Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Google は検索の問題を解決したと多くの人が考えていますが、Google の観点から見ると、検索の発展はまだ始まったばかりです。検索を本に例えるなら、Google は最初の章を書き上げたばかりだ。 Google 検索は 10 年以上にわたり、データ駆動型や実験的評価などの科学的な手法を通じて継続的に改善され、検索エンジンの完成度を高めてきました。最近、Google のエンジニアリング ディレクターであるスコット ハフマン氏は、Google のアルゴリズム改善の背後にある数字を紹介しました。Google は 4.5 兆件以上の検索リクエストを処理し、2011 年には 41,931 件の必要性評価、9,250 件の小規模トライアル、7,363 件のオンライン リアルタイム実験を実施し、最終的に 520 件以上の改善を完了しました。

[[61626]]
Google エンジニアリング ディレクター、スコット ハフマン

Google を通じて情報を検索する場合、ユーザーは Web ページ上で操作を実行するのではなく、Google の Web ページのインデックス内で検索します。 Google の膨大なコンピュータ群は総称して「Google ロボット」と呼ばれています。このロボットはアルゴリズムによって制御され、インターネット上の何十億もの Web ページをクロールして閲覧し、その中のすべての単語のインデックスを作成します。ユーザーが検索リクエストを入力すると、マシンはインデックスで一致する Web ページを検索し、最も関連性の高い検索結果をユーザーに提示します。

Google は、最も関連性の高い検索結果を最短時間でユーザーに提供することに注力しており、それが検索アルゴリズムの継続的な改善の原動力にもなっています。 Google は通常、アルゴリズムを改善するために 3 つのステップを踏みます。まず、各改善の必要性を評価し、次に世界中のさまざまな地域で小規模な実験を行い、最後にランダムにユーザーを選択してリアルタイムのオンライン実験を行います。 Google は常に、検索機能に関する 50 ~ 200 件のオンライン実験を実行しています。これらの正確で秩序だった科学的手法により、最大でも 24 時間で Google.com に優れた改善計画を考案し、実装することができます。 2011 年に、Google は 58,000 件を超える実験を実施し、検索システムに 520 件を超える改善を加えました。

これらの実験を通じて、Google は検索結果からスパムを削除したり、ユーザーのニーズに基づいて検索インターフェースに表示される結果の数を変更したり、異なる地域で同じ単語を検索したときに異なる結果を表示したりするなど、ユーザーの検索エクスペリエンスを継続的に改善することができます。

同時に、Google 検索アルゴリズムは次のような一連の大きな改善を加えました。

  • 鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、Google では最新の検索結果をユーザーに提供する必要がある場合があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。
  • 高品質なウェブサイトのアルゴリズム調整:独自の情報、調査・研究、詳細なレポート、正確な分析などを含む高品質なウェブサイトに非常に有益であり、検索結果でのランキングが向上します。
  • ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

Google検索の背後にある数字

  • Google が検索リクエストに応答するのに通常 0.25 秒しかかかりませんが、平均的な人間の目が瞬きするのには 0.1 秒かかります。
  • Google 検索は 2003 年以来 4,500 億件の検索クエリを処理してきました
  • ユーザーが毎日検索するキーワードの16~20%は新しいものである
  • 平均すると、Google 検索の各キーワードは、ユーザーのコンピューターとデータ センターの間を 750 マイル移動します。
  • Google は、ページランクを含む 200 を超えるランキング指標を検索結果に使用します。
  • Google のインデックスには数十億のウェブページが含まれており、最大 1 億 GB のデータが保存されています。
  • 現在までに、Google は検索アルゴリズムの開発に 1,000 人年以上を投資してきました。
  • Google 検索は 146 の言語をカバーしています
  • Google 検索は世界中に 181 のドメインを持っています

<<:  大量ユーザーポイントのランキングアルゴリズムに関する議論

>>:  Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

ブログ    
ブログ    
ブログ    

推薦する

機械学習におけるラベル漏洩とそれがモデルのパフォーマンスに与える影響について紹介します

優れた、またはほぼ優れたモデルのパフォーマンスに圧倒されていますか? あなたの幸せは裏切られています...

...

Reddit で話題: 言葉では言い表せない写真に透かしを追加することに特化したアプリが AI によって解読されました!

ベルギーの通信会社は、10代の若者向けに「.comdom」というセキュリティアプリをリリースした。こ...

...

買い物客の4分の3がレジなし店舗を試してみたいと考えている

[[418996]]画像ソース: https://pixabay.com/images/id-391...

自動運転が何千もの家庭に普及するまでにどれくらいの時間がかかるのでしょうか?

2019年9月に百度、海亮科技、センスタイムなどの企業が世界初の自動運転車の商用ライセンスを取得し...

データ汚染:次の大きな脅威

人工知能 (AI) と機械学習 (ML) を使用したセキュリティ ソフトウェアを標的としたデータ ポ...

RangePerception: Range View3D 検出への新しいアプローチ!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

AIビジュアルクロスワードパズルが大ヒット!モンローは180度回転して一瞬でアインシュタインになる。Nvidiaの上級AI科学者:最近最もクールな拡散モデル

AIが描いたマリリン・モンローが180°回転してアインシュタインに? !これは、最近ソーシャル メデ...

このトリックにより、トランスフォーマーの推論速度が4.5倍になり、数十万ドルを節約できます。

[[443226]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

トランスフォーマー+強化学習、Google DeepMindは世界を知覚するロボットの脳となる大きなモデルを作る

ロボットの学習方法を開発する際に、大規模で多様なデータセットを統合し、強力で表現力豊かなモデル (T...

テンセントの高性能グラフコンピューティングフレームワークPlatoとそのアルゴリズムの応用

[[318509]]プラトンについてテンセントの高性能グラフコンピューティングフレームワークPlat...

機械学習と脳科学が次の10年間の教育発展をリードする

[51CTO.comよりオリジナル記事] 昨今人気の技術として、産業界における人工知能の応用が徐々に...

チューリングは71年前にニューラルネットワークを提案しました。 「インテリジェントマシン」が再び白熱した議論を巻き起こす

[[269208]]チューリングは 1948 年に「インテリジェント マシン」と題する論文を執筆し、...