Googleは現在、コア検索アルゴリズムに変更を加えており、検索結果の最大10分の1のランキングに影響を及ぼす可能性がある。 Googleは検索アルゴリズムをどのように変更するのか?Googleがアルゴリズムを変更する技術について、原理を変えずに関連記事を引用しまとめました。
この変更は、Google の研究者が開発し、10 か月前に同社の検索製品に適用された最先端の自然言語処理技術 (NLP) に基づいていると報告されています。 Google は、文章中の単語同士の関係をよりよく理解することで検索結果を改善できると主張している。以前、Google はプレスリリースで、検索アルゴリズムが「薬局で誰かのために薬を入手できますか?」というフレーズの意味を解析できた例について説明しました。 Googleの研究者で検索担当副社長のパンドゥ・ナヤック氏は、古いGoogleの検索アルゴリズムは文章を「言葉の集まり」として扱っていたと述べた。そのため、重要な単語、つまり「薬」と「薬局」に注目し、単純にローカルな結果を返します。新しいアルゴリズムは、「誰かのために」という単語の文脈を理解し、これが誰かから処方箋をもらえるかどうかについての質問であることを認識し、正しい結果を返すことができます。 調整されたアルゴリズムは、BERT (Bidirectional Encoder Representations from Transformers) に基づいていると理解されています。BERT は、「Bidirectional Encoder Representations from Transformers」を意味します。重要なのは、BERT は文を「単語の集まり」として扱うのではなく、文全体のすべての単語を見て、「for someone」が文の意味にとって重要であり省略できないことを認識できることです。 BERT がこれらの単語に気づくことを自ら学習することは注目に値します。 Google は英語の文章のコーパスを収集し、単語の 15% をランダムに削除し、削除された単語が何であるかを判断するために BERT を設定しました。これに対して、上級研究員兼研究担当上級副社長のジェフ・ディーン氏は、時間の経過とともに、このトレーニングによりNLPモデルはコンテキストを理解する上でより効果的になるだろうと述べた。 さらに、Google は「縁石のない坂道に駐車する」という別の例も挙げています。 「no」という単語は文章クエリにとって非常に重要ですが、BRET アルゴリズムを実装する前の Google アルゴリズムではこれが無視されていました。 Googleは、過去数日間で、米国の英語検索クエリの10%に影響を与える新しいアルゴリズムを導入したと述べた(他の言語や国については現時点では議論されていない)。 Leifeng.com は、検索結果を確実に改善するために、検索に対するすべての変更は一連のテストを受ける必要があることを知りました。こうしたテストの中には、Google のアルゴリズムを訓練するために、Google の多数の人間のレビュー担当者を使って検索結果の品質を評価するテストもある。それだけでなく、Google はライブ A テストとライブ B テストも実施しました。 すべてのクエリが BERT の影響を受けるわけではないことを理解することが重要です。BERT は、Google が検索結果のランク付けに使用するさまざまなツールの最新のものにすぎません。彼らがどのように協力しているのかは謎のままです。実際、Google は、システムを不正に操作してスパムを送信するのを防ぐために、これらのプロセスの一部を意図的に秘密にしています。 そして、もう 1 つ重要な理由があります。コンピューターが機械学習を使用して決定を下す場合、なぜその選択を行ったのかを知ることは困難です。これは機械学習の「ブラックボックス」問題に関係します。つまり、結果が何らかの点で間違っている場合、その理由を診断することが困難になる可能性があります。 Google は、BERT をアルゴリズムに追加することでバイアスが増大しないように努めてきたと述べた。バイアスは、トレーニング モデルがそもそもバイアスを持つ機械学習でよく見られる問題である。さらに、BERT は英語の文章の膨大なコーパスでトレーニングされており、これには固有のバイアスも含まれているため、これも懸念事項です。 グーグルはまた、少なくとも大手パブリッシャーに関しては、同社のアルゴリズムがトラフィックに大きな変化をもたらすとは予想していないと述べた。実際、Google の検索アルゴリズムに変更があるたびに、ネットワーク全体が注目します。 また、Google の検索ランキングの変更により、一部の企業が現在宙ぶらりん状態になっていることも注目に値します。実際、ウェブトラフィックから収益を得ている人は誰でもこれに注意を払う必要があります。検索結果の品質に関しては、Payak 氏は次のように語っています。
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 |
<<: AI ソフトウェアは教育分野にどのように役立つのでしょうか?
>>: Python でよく使われるアルゴリズム - 貪欲アルゴリズム (別名 greedy algorithm) をご存知ですか?
7月21日、鄭州市の西40キロにある米河鎮は停電、インターネット、道路が遮断され、完全な情報孤島とな...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ルーティング プロトコルの適用は、多くの大規模ネットワークで重要な役割を果たします。誰もがこの知識を...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[51CTO.com クイック翻訳]唇の無精ひげ、額のしわ、皮膚の斑点がはっきりと見えますが、「彼」...
2023年ももうすぐ終わりです。過去1年間で、さまざまな大型モデルがリリースされました。 OpenA...
今日は週末なので、深遠な話をするふりをして話をしましょう。現在、人工知能について議論する場合、ほとん...
揚子江は東に流れ、その波はすべての英雄たちを押し流す。ジャッキー・チェン、ジェット・リー、ジャン=ク...
2023 年の新規建設の大幅な増加は、データ センターの空室率が史上最低水準にある重要な時期に起こり...
「量子コンピューティングの冬が来るのか?」今週の金曜日、AIの先駆者であるヤン・ルカン氏の発言が議論...
ディープラーニングの大規模な応用の後、人々はさらなる技術的進歩をもたらすことができる真の汎用人工知能...
[[188537]] 1. はじめに機械学習は、コンピュータにデータから学習する能力を与え、現在イ...