Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Google は検索の問題を解決したと多くの人が考えていますが、Google の観点から見ると、検索の発展はまだ始まったばかりです。検索を本に例えるなら、Google は最初の章を書き上げたばかりだ。 Google 検索は 10 年以上にわたり、データ駆動型や実験的評価などの科学的な手法を通じて継続的に改善され、検索エンジンの完成度を高めてきました。最近、Google のエンジニアリング ディレクターであるスコット ハフマン氏は、Google のアルゴリズム改善の背後にある数字を紹介しました。Google は 4.5 兆件以上の検索リクエストを処理し、2011 年には 41,931 件の必要性評価、9,250 件の小規模トライアル、7,363 件のオンライン リアルタイム実験を実施し、最終的に 520 件以上の改善を完了しました。

[[61626]]
Google エンジニアリング ディレクター、スコット ハフマン

Google を通じて情報を検索する場合、ユーザーは Web ページ上で操作を実行するのではなく、Google の Web ページのインデックス内で検索します。 Google の膨大なコンピュータ群は総称して「Google ロボット」と呼ばれています。このロボットはアルゴリズムによって制御され、インターネット上の何十億もの Web ページをクロールして閲覧し、その中のすべての単語のインデックスを作成します。ユーザーが検索リクエストを入力すると、マシンはインデックスで一致する Web ページを検索し、最も関連性の高い検索結果をユーザーに提示します。

Google は、最も関連性の高い検索結果を最短時間でユーザーに提供することに注力しており、それが検索アルゴリズムの継続的な改善の原動力にもなっています。 Google は通常、アルゴリズムを改善するために 3 つのステップを踏みます。まず、各改善の必要性を評価し、次に世界中のさまざまな地域で小規模な実験を行い、最後にランダムにユーザーを選択してリアルタイムのオンライン実験を行います。 Google は常に、検索機能に関する 50 ~ 200 件のオンライン実験を実行しています。これらの正確で秩序だった科学的手法により、最大でも 24 時間で Google.com に優れた改善計画を考案し、実装することができます。 2011 年に、Google は 58,000 件を超える実験を実施し、検索システムに 520 件を超える改善を加えました。

これらの実験を通じて、Google は検索結果からスパムを削除したり、ユーザーのニーズに基づいて検索インターフェースに表示される結果の数を変更したり、異なる地域で同じ単語を検索したときに異なる結果を表示したりするなど、ユーザーの検索エクスペリエンスを継続的に改善することができます。

同時に、Google 検索アルゴリズムは次のような一連の大きな改善を加えました。

  • 鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、Google では最新の検索結果をユーザーに提供する必要がある場合があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。
  • 高品質なウェブサイトのアルゴリズム調整:独自の情報、調査・研究、詳細なレポート、正確な分析などを含む高品質なウェブサイトに非常に有益であり、検索結果でのランキングが向上します。
  • ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

Google検索の背後にある数字

  • Google が検索リクエストに応答するのに通常 0.25 秒しかかかりませんが、平均的な人間の目が瞬きするのには 0.1 秒かかります。
  • Google 検索は 2003 年以来 4,500 億件の検索クエリを処理してきました
  • ユーザーが毎日検索するキーワードの16~20%は新しいものである
  • 平均すると、Google 検索の各キーワードは、ユーザーのコンピューターとデータ センターの間を 750 マイル移動します。
  • Google は、ページランクを含む 200 を超えるランキング指標を検索結果に使用します。
  • Google のインデックスには数十億のウェブページが含まれており、最大 1 億 GB のデータが保存されています。
  • 現在までに、Google は検索アルゴリズムの開発に 1,000 人年以上を投資してきました。
  • Google 検索は 146 の言語をカバーしています
  • Google 検索は世界中に 181 のドメインを持っています

<<:  大量ユーザーポイントのランキングアルゴリズムに関する議論

>>:  Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

ブログ    
ブログ    

推薦する

顔認識アプリケーションの境界はどこにあるのでしょうか?

日常生活における新しい技術の普及により、個人情報の漏洩に対する国民の懸念が生じている。顔認識アプリケ...

ワンクリックで顔のピクセル画像を生成し、Animal Crossingにアップロードしましょう!このプロジェクトは楽しい

日本の独立系開発者佐藤氏はアスペルガー症候群のため学校を中退、退職。その後独学でAIを学び、AI画伯...

プロの債権回収業者は失業するのでしょうか?人工知能はこうやって人々にお金を返済させる

他人に代わって借金を回収する「プロの債権回収業者」というと、恐ろしいイメージを抱く人も多いだろう。 ...

機械学習を活用して人事部門の時間を節約する方法

導入履歴書データベースに「ソフトウェア エンジニア」という名前の履歴書が 10,000 件あるとしま...

HarmonyOS メタサービス開発実践: デスクトップカード辞書

1. プロジェクトの説明1.DEMOのアイデアはカード辞書です。 2. カードによって表示される内容...

2021年4月の自動運転分野における重要な進展の概要

2021年に入ってから、自動運転分野の開発は着実に進展しており、4月には自動運転関連のさまざまな動き...

ロボットを活用する3つの革新的な方法

ロボットは、高齢の両親を助けたり、子供を教育したり、料理をしたりすることができます。ロボット産業は創...

看護ロボットは医療従事者の仕事に完全に取って代わることができるのでしょうか?

研究によると、共感と前向きな指導は、医師が患者の痛みを和らげ、術後の回復を早め、精神科薬の使用を減ら...

GPT-4: 私が書いたコードを使ってみますか?調査によると、APIの不正使用率は62%を超えている。

言語モデリングの新しい時代が到来し、大規模言語モデル (LLM) は自然言語を理解するだけでなく、ユ...

...

かつては世界トップ50のロボット技術企業の一つだったスターロボット企業がまた一つ倒産した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIエージェントに完全な人生を与えましょう! HKU NYU Xie Sainingらによる最新の知的研究:仮想は現実である

より強力な AI エージェントを構築するにはどうすればよいでしょうか?答えは、彼らに完全で現実的な世...

私たちの重要なインフラは人工知能に対応できるでしょうか?

ChatGPT を楽しみや機能のために使用する個人から、タスクの自動化に人工知能 (AI) を適用...

インテリジェントな人間と機械のインタラクションがデジタルサービスを新たなレベルに引き上げます

2020年という「長い」年が、あっという間に終わりを迎えようとしています。この時期を振り返ると、長い...

医師は患者のがん治療を支援するためにディープラーニングアルゴリズムを使用している

▲ 液体生検は費用対効果が高く、生検全体のプロセスを大幅に簡素化できます。 Wikipedia によ...