Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Google は検索の問題を解決したと多くの人が考えていますが、Google の観点から見ると、検索の発展はまだ始まったばかりです。検索を本に例えるなら、Google は最初の章を書き上げたばかりだ。 Google 検索は 10 年以上にわたり、データ駆動型や実験的評価などの科学的な手法を通じて継続的に改善され、検索エンジンの完成度を高めてきました。最近、Google のエンジニアリング ディレクターであるスコット ハフマン氏は、Google のアルゴリズム改善の背後にある数字を紹介しました。Google は 4.5 兆件以上の検索リクエストを処理し、2011 年には 41,931 件の必要性評価、9,250 件の小規模トライアル、7,363 件のオンライン リアルタイム実験を実施し、最終的に 520 件以上の改善を完了しました。

[[61626]]
Google エンジニアリング ディレクター、スコット ハフマン

Google を通じて情報を検索する場合、ユーザーは Web ページ上で操作を実行するのではなく、Google の Web ページのインデックス内で検索します。 Google の膨大なコンピュータ群は総称して「Google ロボット」と呼ばれています。このロボットはアルゴリズムによって制御され、インターネット上の何十億もの Web ページをクロールして閲覧し、その中のすべての単語のインデックスを作成します。ユーザーが検索リクエストを入力すると、マシンはインデックスで一致する Web ページを検索し、最も関連性の高い検索結果をユーザーに提示します。

Google は、最も関連性の高い検索結果を最短時間でユーザーに提供することに注力しており、それが検索アルゴリズムの継続的な改善の原動力にもなっています。 Google は通常、アルゴリズムを改善するために 3 つのステップを踏みます。まず、各改善の必要性を評価し、次に世界中のさまざまな地域で小規模な実験を行い、最後にランダムにユーザーを選択してリアルタイムのオンライン実験を行います。 Google は常に、検索機能に関する 50 ~ 200 件のオンライン実験を実行しています。これらの正確で秩序だった科学的手法により、最大でも 24 時間で Google.com に優れた改善計画を考案し、実装することができます。 2011 年に、Google は 58,000 件を超える実験を実施し、検索システムに 520 件を超える改善を加えました。

これらの実験を通じて、Google は検索結果からスパムを削除したり、ユーザーのニーズに基づいて検索インターフェースに表示される結果の数を変更したり、異なる地域で同じ単語を検索したときに異なる結果を表示したりするなど、ユーザーの検索エクスペリエンスを継続的に改善することができます。

同時に、Google 検索アルゴリズムは次のような一連の大きな改善を加えました。

  • 鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、Google では最新の検索結果をユーザーに提供する必要がある場合があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。
  • 高品質なウェブサイトのアルゴリズム調整:独自の情報、調査・研究、詳細なレポート、正確な分析などを含む高品質なウェブサイトに非常に有益であり、検索結果でのランキングが向上します。
  • ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

Google検索の背後にある数字

  • Google が検索リクエストに応答するのに通常 0.25 秒しかかかりませんが、平均的な人間の目が瞬きするのには 0.1 秒かかります。
  • Google 検索は 2003 年以来 4,500 億件の検索クエリを処理してきました
  • ユーザーが毎日検索するキーワードの16~20%は新しいものである
  • 平均すると、Google 検索の各キーワードは、ユーザーのコンピューターとデータ センターの間を 750 マイル移動します。
  • Google は、ページランクを含む 200 を超えるランキング指標を検索結果に使用します。
  • Google のインデックスには数十億のウェブページが含まれており、最大 1 億 GB のデータが保存されています。
  • 現在までに、Google は検索アルゴリズムの開発に 1,000 人年以上を投資してきました。
  • Google 検索は 146 の言語をカバーしています
  • Google 検索は世界中に 181 のドメインを持っています

<<:  大量ユーザーポイントのランキングアルゴリズムに関する議論

>>:  Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

ブログ    
ブログ    

推薦する

人工知能が「より賢くなる」ためには、計算能力をアップグレードする必要がある

人工知能に関する最新の報告書「2020-2021年中国人工知能コンピューティング力発展評価報告書」が...

私の国は自動運転のための最初の閉鎖された高速道路テスト環境を構築しました

1月21日、公安部交通管理科学研究所は、工業情報化部、公安部、江蘇省人民政府が共同で建設する「国家イ...

オフライン小売業で AI 自動チェックアウト サービスを構築するにはどうすればよいでしょうか?

翻訳者 | 邱凱校正 | 梁哲、孫淑娟列に並ぶ必要がなく、遅延もなく、便利に購入できるという顧客体験...

AIビジョンを取り入れることで、ガソリンスタンドは非常に「スマート」になることができます

[[354264]]石油貯蔵所、ガソリンスタンド、石油荷降ろしトラックには大量の完成燃料が保管され...

GPT-X に基づく製品コピーライティングと画像生成の実践

I. はじめに1. 2022年末に人気が高まったOpenAIとAIGC 2022年はAIの歴史におい...

TensorFlow 機械学習の初心者向けガイド: 線形回帰を実装するには?

TensorFlow 入門記事: 初心者でも理解できる TensorFlow 入門小学校で受けた理...

ルーティングテーブルとルーター選択アルゴリズム

標準ルーティングテーブル1.次駅経路選定の基本的な考え方ルーティング テーブルは、宛先までの完全なパ...

...

AIは教育分野にどのように貢献できるのでしょうか?

調査機関Markets&Marketsの予測によると、2023年までに世界の教育業界における...

...

アルゴリズムの時間計算量分析: Big O 表記

[[354643]]開発の際、アルゴリズムの品質をどのように評価し、アルゴリズムの効率をどのように説...

R言語におけるAprioriアルゴリズムの応用

[[193979]] I. コンセプト関連性分析は、大規模なデータセットに隠された意味のあるつながり...

機械学習が物流、輸送、旅行を変革

スイスはアルプス山脈の高速道路で何万台もの貨物トラックによる渋滞と汚染に直面したため、世界最長かつ最...

...