Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

3月12日の朝、Googleが検索リクエストを完了するのにかかった時間は1秒未満でしたが、平均往復距離は約2,400キロメートルでした。 Google では、アルゴリズムを改善するために常時 200 件以上のオンライン実験を行っており、アイデアが実装される前に複数のテストに合格する必要があります。パーソナライズされた検索がますます重要になるにつれ、Google アルゴリズムの改善も新たな課題に直面しています。


検索を完了するための基本的なプロセス(画像提供:Google)

公式データによると、Google 検索は 2003 年から現在までに 4,500 億件を超える検索リクエストを受信して​​います。ユーザーが毎日発行する検索リクエストのうち、16~20% がまったく新しいキーワードです。

基本的な検索プロセスは、検索リクエストの送信 -> 送信 -> カテゴリのフィルタリング -> 検索インデックス -> Web ページの選択 -> 結果のランキング -> 結果の表示という手順で構成されます。 Google の説明によれば、リクエストは数千のデータセンターに分散され、キーワードに応じてマッチングされ、結果として得られたデータは数百の指標に基づいてランク付けされるという。

この複雑なプロセスは通常 1 秒以内に完了しますが、平均的な Google 検索キーワードはユーザーのコンピューターとデータ センターの間を約 2,400 キロメートル (1,500 マイル) 移動します。

「Googleは検索の問題を解決したと多くの人が考えているが、Googleの見方では、検索の開発はまだ始まったばかりだ。検索が本だとしたら、Googleは最初の章を書いたばかりだ」と、Googleのエンジニアリングディレクター、スコット・ハフマン氏は検索について語った。Googleの検索アルゴリズムは10年以上にわたって継続的に改良されてきた。

Google の検索結果は毎年約 20 ~ 30% 変化します。ホフマン氏の主な仕事の一つは、Google 検索の品質を評価することだが、そのプロセスは外部の人々が見ているよりもはるかに複雑だと同氏は考えている。

昨年を例にとると、多数の検索アルゴリズム改善案のうち、41,831件について必要性が評価され、そのうち9,250件について小規模実験が行われ、7,363件についてオンライン実験が行われ、最終的に520件以上の改善が実施されました。ホフマン氏は、アルゴリズムの改善に対する Google のアプローチを、データ駆動型および実験的評価と要約しました。

Google 検索では、平均して常時 200 件以上の実験が実行されており、評価プロセスでは統計モデルと複数の言語の独立した評価者の両方が使用されます。

ホフマン氏は、Googleの検索アルゴリズムの最近の主な改善点は3つの側面にまとめられると述べた。

鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、場合によっては Google はユーザーに最適な検索結果を提供する必要があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。

·高品質ウェブサイトのアルゴリズムの調整:これは、独自の情報、研究と調査、詳細なレポート、正確な分析などを含む高品質ウェブサイトに非常に有益であり、検索結果でのランキングを向上させます。

ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

さらに、Google は、ソーシャル、モバイル、位置情報などの情報要素をさらに検索に統合する予定です。これにより、一方では検索結果がよりパーソナライズされるようになりますが、同時に Google にとって新たな課題も生じます。それは、ますますパーソナライズされる検索結果をどのように測定し、改善するかということです。これまでの実験方法を調整する必要があります。

ホフマン氏は、パーソナライゼーションの影響をより受けやすい要素については、Google はより多くのオンライン実験的手法を使用して調査すると説明した。たとえば、ユーザーのジャンプや滞在時間を調べ、統計モデルを通じて関連データを分析および判断します。また、評価者の個人情報は許可を得て取得し、検索結果の向上に役立てています。

「アルゴリズム改善のための新しいアイデアは、問題を解決するときによく生まれる」とホフマン氏は述べ、グーグルは検索アルゴリズムの開発に1,000人年以上を費やしてきたと付け加えた。

<<:  Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

>>:  Google のアルゴリズムが明らかに: 検索リクエストは平均 2,400 キロメートル往復移動します

推薦する

NIST: AIの偏りはデータだけにとどまらない

現時点では、ほとんどの AI がある程度問題のある偏見に基づいて構築され、現在もそれを使用しているこ...

推薦システムの主なアルゴリズムの概要とYoutubeのディープラーニング推薦アルゴリズムの例

協調フィルタリング協調フィルタリング (CF) とそのバリエーションは、最も一般的に使用される推奨ア...

オンライン学習の次の波: 現代の学習システムにおける人工知能

[[375015]]世界的な流行により、ほぼすべての大学が授業をオンライン学習プラットフォームに移行...

コードを自動生成できるAIベースの開発ツール5選

今日、機械学習の可能性に関心を持つプログラマーは、人工知能と AI ベースのソフトウェア開発ツールを...

Meituan はどのようにしてディープラーニングに基づくインテリジェントな画像レビューを実現するのでしょうか?

はじめに:AI(人工知能)技術は、Meituan AppからDianping App、フードデリバリ...

勾配降下法から準ニュートン法まで: ニューラル ネットワークをトレーニングするための 5 つの学習アルゴリズム

ニューラル ネットワークでは、システムの学習プロセスは一般にトレーニング アルゴリズムによって支配さ...

世界のAI競争は中国と米国がリード。人工知能は過大評価されているのか?

[[315351]]少し前、グーグルの元CEOであるシュミット氏は下院科学宇宙技術委員会の公聴会で...

企業がクラウドに移行する際、IT 運用と保守は AI を通じてどのようにインテリジェンスを実現できるでしょうか?

近年、あらゆる分野でインターネット+が採用され、クラウドコンピューティングやビッグデータなどの技術を...

人工知能はアプリのない世界をもたらすのでしょうか?

[[248121]] [[248122]]最近はアプリが満載のスマートフォンを持っている人はほとん...

データマイニングの専門家がプログラムアルゴリズムを使って人生の選択をする

[[118153]]毎年、就職活動の時期になると、どうやって内定を選んだらいいのか、テンセントに行く...

北京冬季オリンピックと人工知能が出会うと、どんな火花が散るのでしょうか?

2008年、北京オリンピックのテクノロジーと壮大な雰囲気は世界に深い印象を残しました。 2022年...

...

ロボットはペンを回したりクルミを転がしたりすることを学びました。 GPT-4では、タスクが複雑になるほどパフォーマンスが向上します

ビッグデータダイジェスト制作親愛なる友人たち、人工知能(AI)がチェス、囲碁、Dotaを征服した後、...

高性能な PyTorch はどのように実現されるのでしょうか?経験豊富な専門家がまとめた落とし穴を避ける10のヒント

最小限の労力で最も効率的な PyTorch トレーニングを完了するにはどうすればよいでしょうか? P...

不動産会社のデジタル変革は差し迫っています。これらの AI イノベーションは試してみる価値があるかもしれません。

不動産会社のデジタル変革は差し迫っています。試してみるべき革新的な方法をいくつかご紹介します。今日の...