Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleは現在、コア検索アルゴリズムに変更を加えており、検索結果の最大10分の1のランキングに影響を及ぼす可能性がある。 Googleは検索アルゴリズムをどのように変更するのか?Googleがアルゴリズムを変更する技術について、原理を変えずに関連記事を引用しまとめました。

[[280679]]

【画像出典:THE VERGE オーナー:THE VERGE】

この変更は、Google の研究者が開発し、10 か月前に同社の検索製品に適用された最先端の自然言語処理技術 (NLP) に基づいていると報告されています。 Google は、文章中の単語同士の関係をよりよく理解することで検索結果を改善できると主張している。以前、Google はプレスリリースで、検索アルゴリズムが「薬局で誰かのために薬を入手できますか?」というフレーズの意味を解析できた例について説明しました。

Googleの研究者で検索担当副社長のパンドゥ・ナヤック氏は、古いGoogleの検索アルゴリズムは文章を「言葉の集まり」として扱っていたと述べた。そのため、重要な単語、つまり「薬」と「薬局」に注目し、単純にローカルな結果を返します。新しいアルゴリズムは、「誰かのために」という単語の文脈を理解し、これが誰かから処方箋をもらえるかどうかについての質問であることを認識し、正しい結果を返すことができます。

調整されたアルゴリズムは、BERT (Bidirectional Encoder Representations from Transformers) に基づいていると理解されています。BERT は、「Bidirectional Encoder Representations from Transformers」を意味します。重要なのは、BERT は文を「単語の集まり」として扱うのではなく、文全体のすべての単語を見て、「for someone」が文の意味にとって重要であり省略できないことを認識できることです。

BERT がこれらの単語に気づくことを自ら学習することは注目に値します。 Google は英語の文章のコーパスを収集し、単語の 15% をランダムに削除し、削除された単語が何であるかを判断するために BERT を設定しました。これに対して、上級研究員兼研究担当上級副社長のジェフ・ディーン氏は、時間の経過とともに、このトレーニングによりNLPモデルはコンテキストを理解する上でより効果的になるだろうと述べた。

さらに、Google は「縁石のない坂道に駐車する」という別の例も挙げています。 「no」という単語は文章クエリにとって非常に重要ですが、BRET アルゴリズムを実装する前の Google アルゴリズムではこれが無視されていました。

【画像出典:THE VERGE オーナー:THE VERGE】

Googleは、過去数日間で、米国の英語検索クエリの10%に影響を与える新しいアルゴリズムを導入したと述べた(他の言語や国については現時点では議論されていない)。

Leifeng.com は、検索結果を確実に改善するために、検索に対するすべての変更は一連のテストを受ける必要があることを知りました。こうしたテストの中には、Google のアルゴリズムを訓練するために、Google の多数の人間のレビュー担当者を使って検索結果の品質を評価するテストもある。それだけでなく、Google はライブ A テストとライブ B テストも実施しました。

すべてのクエリが BERT の影響を受けるわけではないことを理解することが重要です。BERT は、Google が検索結果のランク付けに使用するさまざまなツールの最新のものにすぎません。彼らがどのように協力しているのかは謎のままです。実際、Google は、システムを不正に操作してスパムを送信するのを防ぐために、これらのプロセスの一部を意図的に秘密にしています。

そして、もう 1 つ重要な理由があります。コンピューターが機械学習を使用して決定を下す場合、なぜその選択を行ったのかを知ることは困難です。これは機械学習の「ブラックボックス」問題に関係します。つまり、結果が何らかの点で間違っている場合、その理由を診断することが困難になる可能性があります。

Google は、BERT をアルゴリズムに追加することでバイアスが増大しないように努めてきたと述べた。バイアスは、トレーニング モデルがそもそもバイアスを持つ機械学習でよく見られる問題である。さらに、BERT は英語の文章の膨大なコーパスでトレーニングされており、これには固有のバイアスも含まれているため、これも懸念事項です。

グーグルはまた、少なくとも大手パブリッシャーに関しては、同社のアルゴリズムがトラフィックに大きな変化をもたらすとは予想していないと述べた。実際、Google の検索アルゴリズムに変更があるたびに、ネットワーク全体が注目します。

また、Google の検索ランキングの変更により、一部の企業が現在宙ぶらりん状態になっていることも注目に値します。実際、ウェブトラフィックから収益を得ている人は誰でもこれに注意を払う必要があります。検索結果の品質に関しては、Payak 氏は次のように語っています。

  • これが最大の変化です。過去 5 年間で私たちが経験した中で最も前向きな変化であり、おそらく創業以来最大の変化の 1 つでしょう。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

<<:  AI ソフトウェアは教育分野にどのように役立つのでしょうか?

>>:  Python でよく使われるアルゴリズム - 貪欲アルゴリズム (別名 greedy algorithm) をご存知ですか?

ブログ    
ブログ    

推薦する

大雨後のドローンと衛星ネットワーク

7月21日、鄭州市の西40キロにある米河鎮は停電、インターネット、道路が遮断され、完全な情報孤島とな...

AIを使用してC++、Java、Pythonコードを翻訳し、最大成功率は80.9%です。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ルーティングプロトコルアルゴリズム

ルーティング プロトコルの適用は、多くの大規模ネットワークで重要な役割を果たします。誰もがこの知識を...

追跡!フレーム!明らかにする!秘密!ついにボストンダイナミクスのロボットの詳細が明らかになった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

これらの不気味な「偽人間」は人工知能の新時代の到来を告げる

[51CTO.com クイック翻訳]唇の無精ひげ、額のしわ、皮膚の斑点がはっきりと見えますが、「彼」...

2024年のAIトレンド、このグラフをご覧ください、LeCun: オープンソースのビッグモデルがクローズドソースを上回る

2023年ももうすぐ終わりです。過去1年間で、さまざまな大型モデルがリリースされました。 OpenA...

「認知の輪」を解読する:AIと人間の究極の戦い

今日は週末なので、深遠な話をするふりをして話をしましょう。現在、人工知能について議論する場合、ほとん...

二足歩行ロボットは撮影以外にも応用シーンが多すぎて問題になっている

揚子江は東に流れ、その波はすべての英雄たちを押し流す。ジャッキー・チェン、ジェット・リー、ジャン=ク...

データセンター: クラウドと AI 導入の鍵となる要素

2023 年の新規建設の大幅な増加は、データ センターの空室率が史上最低水準にある重要な時期に起こり...

...

量子コンピューティングの冬が来る、ルカン氏:現実は残酷、誇大宣伝が多すぎる

「量子コンピューティングの冬が来るのか?」今週の金曜日、AIの先駆者であるヤン・ルカン氏の発言が議論...

チューリング賞受賞者のヤン・ルカン氏:今後数十年間の AI 研究の最大の課題は「予測世界モデル」

ディープラーニングの大規模な応用の後、人々はさらなる技術的進歩をもたらすことができる真の汎用人工知能...

...

...

マルウェア検出のための機械学習

[[188537]] 1. はじめに機械学習は、コンピュータにデータから学習する能力を与え、現在イ...