Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleは現在、コア検索アルゴリズムに変更を加えており、検索結果の最大10分の1のランキングに影響を及ぼす可能性がある。 Googleは検索アルゴリズムをどのように変更するのか?Googleがアルゴリズムを変更する技術について、原理を変えずに関連記事を引用しまとめました。

[[280679]]

【画像出典:THE VERGE オーナー:THE VERGE】

この変更は、Google の研究者が開発し、10 か月前に同社の検索製品に適用された最先端の自然言語処理技術 (NLP) に基づいていると報告されています。 Google は、文章中の単語同士の関係をよりよく理解することで検索結果を改善できると主張している。以前、Google はプレスリリースで、検索アルゴリズムが「薬局で誰かのために薬を入手できますか?」というフレーズの意味を解析できた例について説明しました。

Googleの研究者で検索担当副社長のパンドゥ・ナヤック氏は、古いGoogleの検索アルゴリズムは文章を「言葉の集まり」として扱っていたと述べた。そのため、重要な単語、つまり「薬」と「薬局」に注目し、単純にローカルな結果を返します。新しいアルゴリズムは、「誰かのために」という単語の文脈を理解し、これが誰かから処方箋をもらえるかどうかについての質問であることを認識し、正しい結果を返すことができます。

調整されたアルゴリズムは、BERT (Bidirectional Encoder Representations from Transformers) に基づいていると理解されています。BERT は、「Bidirectional Encoder Representations from Transformers」を意味します。重要なのは、BERT は文を「単語の集まり」として扱うのではなく、文全体のすべての単語を見て、「for someone」が文の意味にとって重要であり省略できないことを認識できることです。

BERT がこれらの単語に気づくことを自ら学習することは注目に値します。 Google は英語の文章のコーパスを収集し、単語の 15% をランダムに削除し、削除された単語が何であるかを判断するために BERT を設定しました。これに対して、上級研究員兼研究担当上級副社長のジェフ・ディーン氏は、時間の経過とともに、このトレーニングによりNLPモデルはコンテキストを理解する上でより効果的になるだろうと述べた。

さらに、Google は「縁石のない坂道に駐車する」という別の例も挙げています。 「no」という単語は文章クエリにとって非常に重要ですが、BRET アルゴリズムを実装する前の Google アルゴリズムではこれが無視されていました。

【画像出典:THE VERGE オーナー:THE VERGE】

Googleは、過去数日間で、米国の英語検索クエリの10%に影響を与える新しいアルゴリズムを導入したと述べた(他の言語や国については現時点では議論されていない)。

Leifeng.com は、検索結果を確実に改善するために、検索に対するすべての変更は一連のテストを受ける必要があることを知りました。こうしたテストの中には、Google のアルゴリズムを訓練するために、Google の多数の人間のレビュー担当者を使って検索結果の品質を評価するテストもある。それだけでなく、Google はライブ A テストとライブ B テストも実施しました。

すべてのクエリが BERT の影響を受けるわけではないことを理解することが重要です。BERT は、Google が検索結果のランク付けに使用するさまざまなツールの最新のものにすぎません。彼らがどのように協力しているのかは謎のままです。実際、Google は、システムを不正に操作してスパムを送信するのを防ぐために、これらのプロセスの一部を意図的に秘密にしています。

そして、もう 1 つ重要な理由があります。コンピューターが機械学習を使用して決定を下す場合、なぜその選択を行ったのかを知ることは困難です。これは機械学習の「ブラックボックス」問題に関係します。つまり、結果が何らかの点で間違っている場合、その理由を診断することが困難になる可能性があります。

Google は、BERT をアルゴリズムに追加することでバイアスが増大しないように努めてきたと述べた。バイアスは、トレーニング モデルがそもそもバイアスを持つ機械学習でよく見られる問題である。さらに、BERT は英語の文章の膨大なコーパスでトレーニングされており、これには固有のバイアスも含まれているため、これも懸念事項です。

グーグルはまた、少なくとも大手パブリッシャーに関しては、同社のアルゴリズムがトラフィックに大きな変化をもたらすとは予想していないと述べた。実際、Google の検索アルゴリズムに変更があるたびに、ネットワーク全体が注目します。

また、Google の検索ランキングの変更により、一部の企業が現在宙ぶらりん状態になっていることも注目に値します。実際、ウェブトラフィックから収益を得ている人は誰でもこれに注意を払う必要があります。検索結果の品質に関しては、Payak 氏は次のように語っています。

  • これが最大の変化です。過去 5 年間で私たちが経験した中で最も前向きな変化であり、おそらく創業以来最大の変化の 1 つでしょう。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

<<:  AI ソフトウェアは教育分野にどのように役立つのでしょうか?

>>:  Python でよく使われるアルゴリズム - 貪欲アルゴリズム (別名 greedy algorithm) をご存知ですか?

ブログ    
ブログ    
ブログ    

推薦する

人工知能によって破壊される10の業界

1. ヘルスケアAI によって混乱が生じる最も重要な業界の一つはヘルスケアです。人工知能と機械学習の...

機械学習モデルのパフォーマンスを評価する方法

教師あり機械学習モデルを一日中トレーニングすることはできますが、そのパフォーマンスを評価しなければ、...

あらゆるビジネスオペレーションに AI を効果的に適用する 10 の方法

企業は、業務に AI を実装するさまざまな方法を分析し、理解する必要があります。 人工知能(AI)は...

ロボット「ソフィア」の現状は普通の人間と変わらず、コミュニケーション障壁もない

ハイテクノロジーの発展により、ロボットは映画に登場するものではなく、現実のものとなりました。人工知能...

...

Googleは社内でAIを使ったコンピュータチップの開発を試みていることを明らかに

グーグルの人工知能研究責任者ジェフ・ディーン氏によると、同社は人工知能プログラムを搭載したソフトウェ...

...

10億件の速達配送のピークを迎える中、Baidu OCRが物流企業のスピードアップにどのように貢献しているかをご覧ください。

ダブル11の大割引が戻ってきました。新規のお客様が最初に購入できる厳選商品...速達便のビジネスプロ...

ディープラーニングを使って背景を除去し、切り抜きを実現する方法の詳細な説明

上記のコースで、経験豊富な Web 開発者である Alon Burg と出会い、偶然にも同じような興...

最も美しいデジタルガールフレンドをDIYしましょう! MITが最強の仮想人間ジェネレーターのソースコードを公開、ネイチャー誌に掲載

MITメディアラボの研究者らは、仮想キャラクターを生成するツールをオープンソース化した。このツールは...

2021年の新ドローンの在庫

[[441702]]時は経つのが早く、2021年も過ぎ去りつつあります。今年を振り返ると、疫病の影響...

2022年、どのような技術トレンドが世界を変え続けるのでしょうか?以下は百度研究所の予測です。

あっという間に2021年が過ぎ去りました。今年、新型コロナウイルス感染症のパンデミックは世界経済と社...

AI 導入の謎を解明: クラウドとエッジ

現在、ディープラーニング テクノロジーを展開できる方法としては、デバイス上への直接展開、クラウド内へ...

2021 年の人工知能の最新動向を示す 15 のグラフ

2021年AIインデックスレポートは、スタンフォード大学の人間中心AI研究所と、ハーバード大学、経済...