Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Google は検索の問題を解決したと多くの人が考えていますが、Google の観点から見ると、検索の発展はまだ始まったばかりです。検索を本に例えるなら、Google は最初の章を書き上げたばかりだ。 Google 検索は 10 年以上にわたり、データ駆動型や実験的評価などの科学的な手法を通じて継続的に改善され、検索エンジンの完成度を高めてきました。最近、Google のエンジニアリング ディレクターであるスコット ハフマン氏は、Google のアルゴリズム改善の背後にある数字を紹介しました。Google は 4.5 兆件以上の検索リクエストを処理し、2011 年には 41,931 件の必要性評価、9,250 件の小規模トライアル、7,363 件のオンライン リアルタイム実験を実施し、最終的に 520 件以上の改善を完了しました。

[[61626]]
Google エンジニアリング ディレクター、スコット ハフマン

Google を通じて情報を検索する場合、ユーザーは Web ページ上で操作を実行するのではなく、Google の Web ページのインデックス内で検索します。 Google の膨大なコンピュータ群は総称して「Google ロボット」と呼ばれています。このロボットはアルゴリズムによって制御され、インターネット上の何十億もの Web ページをクロールして閲覧し、その中のすべての単語のインデックスを作成します。ユーザーが検索リクエストを入力すると、マシンはインデックスで一致する Web ページを検索し、最も関連性の高い検索結果をユーザーに提示します。

Google は、最も関連性の高い検索結果を最短時間でユーザーに提供することに注力しており、それが検索アルゴリズムの継続的な改善の原動力にもなっています。 Google は通常、アルゴリズムを改善するために 3 つのステップを踏みます。まず、各改善の必要性を評価し、次に世界中のさまざまな地域で小規模な実験を行い、最後にランダムにユーザーを選択してリアルタイムのオンライン実験を行います。 Google は常に、検索機能に関する 50 ~ 200 件のオンライン実験を実行しています。これらの正確で秩序だった科学的手法により、最大でも 24 時間で Google.com に優れた改善計画を考案し、実装することができます。 2011 年に、Google は 58,000 件を超える実験を実施し、検索システムに 520 件を超える改善を加えました。

これらの実験を通じて、Google は検索結果からスパムを削除したり、ユーザーのニーズに基づいて検索インターフェースに表示される結果の数を変更したり、異なる地域で同じ単語を検索したときに異なる結果を表示したりするなど、ユーザーの検索エクスペリエンスを継続的に改善することができます。

同時に、Google 検索アルゴリズムは次のような一連の大きな改善を加えました。

  • 鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、Google では最新の検索結果をユーザーに提供する必要がある場合があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。
  • 高品質なウェブサイトのアルゴリズム調整:独自の情報、調査・研究、詳細なレポート、正確な分析などを含む高品質なウェブサイトに非常に有益であり、検索結果でのランキングが向上します。
  • ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

Google検索の背後にある数字

  • Google が検索リクエストに応答するのに通常 0.25 秒しかかかりませんが、平均的な人間の目が瞬きするのには 0.1 秒かかります。
  • Google 検索は 2003 年以来 4,500 億件の検索クエリを処理してきました
  • ユーザーが毎日検索するキーワードの16~20%は新しいものである
  • 平均すると、Google 検索の各キーワードは、ユーザーのコンピューターとデータ センターの間を 750 マイル移動します。
  • Google は、ページランクを含む 200 を超えるランキング指標を検索結果に使用します。
  • Google のインデックスには数十億のウェブページが含まれており、最大 1 億 GB のデータが保存されています。
  • 現在までに、Google は検索アルゴリズムの開発に 1,000 人年以上を投資してきました。
  • Google 検索は 146 の言語をカバーしています
  • Google 検索は世界中に 181 のドメインを持っています

<<:  大量ユーザーポイントのランキングアルゴリズムに関する議論

>>:  Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ジェネレーティブ AI 初心者ガイド

ソフトウェア アーキテクトとして、私は人工知能 (AI) の発展とさまざまな業界でのその応用を目の当...

...

科学者はロボットに人間に近い触覚を与える人工指先を開発

ロボットは車を持ち上げたり、手術を手伝ったりするようにプログラムできますが、卵など、これまで扱ったこ...

Mamba 論文が ICLR に受け入れられなかったのはなぜですか? AIコミュニティは盛り上がっている

2023年、大規模AIモデルの分野におけるTransformerの優位性が揺らいだ。この挑戦のきっか...

...

...

AI革命をリードする:企業がAIアプリケーションを推進するためのベストプラクティス

AI がより高度化し、普及するにつれて、多くの企業が最高 AI 責任者 (CAIO) を任命するかど...

5G、Wi-Fi 6、AIがいかにしてよりスマートなホームエクスペリエンスを実現するか

[[335277]]家全体のスマートホームライフが実現するまでには、まだ時間がかかりそうですが、スマ...

...

AIがITサービス管理をどう変えるか

SF映画に登場する人工知能(AI)ロボットは、通常、非常に賢く器用です。 [[276115]]人工知...

...

DAYU200は自閉症の早期スクリーニング音声特徴フィルタリングおよび認識システムを運用しています

オープンソースの詳細については、以下をご覧ください。 51CTO オープンソース基本ソフトウェアコミ...

スタンフォード大学がAI法の講座を開設。人工知能は法律の対象になり得るか?

昨年3月、アリゾナ州でウーバーの自動運転車が歩行者をはねて死亡させた。米国の検察当局が「ウーバーに責...

AI戦争が近づく中、ChatGPTが軍事禁止を解除

先週末、大手人工知能企業OpenAIは、ChatGPTの使用ポリシーから軍事利用を禁止する条項をひっ...

200以上の大規模モデル論文の調査と分析、数十人の研究者が1つの論文でRLHFの課題と限界をレビュー

ChatGPTの登場以来、OpenAIが使用するトレーニング方法である人間によるフィードバックによる...