Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

3月12日の朝、Googleが検索リクエストを完了するのにかかった時間は1秒未満でしたが、平均往復距離は約2,400キロメートルでした。 Google では、アルゴリズムを改善するために常時 200 件以上のオンライン実験を行っており、アイデアが実装される前に複数のテストに合格する必要があります。パーソナライズされた検索がますます重要になるにつれ、Google アルゴリズムの改善も新たな課題に直面しています。


検索を完了するための基本的なプロセス(画像提供:Google)

公式データによると、Google 検索は 2003 年から現在までに 4,500 億件を超える検索リクエストを受信して​​います。ユーザーが毎日発行する検索リクエストのうち、16~20% がまったく新しいキーワードです。

基本的な検索プロセスは、検索リクエストの送信 -> 送信 -> カテゴリのフィルタリング -> 検索インデックス -> Web ページの選択 -> 結果のランキング -> 結果の表示という手順で構成されます。 Google の説明によれば、リクエストは数千のデータセンターに分散され、キーワードに応じてマッチングされ、結果として得られたデータは数百の指標に基づいてランク付けされるという。

この複雑なプロセスは通常 1 秒以内に完了しますが、平均的な Google 検索キーワードはユーザーのコンピューターとデータ センターの間を約 2,400 キロメートル (1,500 マイル) 移動します。

「Googleは検索の問題を解決したと多くの人が考えているが、Googleの見方では、検索の開発はまだ始まったばかりだ。検索が本だとしたら、Googleは最初の章を書いたばかりだ」と、Googleのエンジニアリングディレクター、スコット・ハフマン氏は検索について語った。Googleの検索アルゴリズムは10年以上にわたって継続的に改良されてきた。

Google の検索結果は毎年約 20 ~ 30% 変化します。ホフマン氏の主な仕事の一つは、Google 検索の品質を評価することだが、そのプロセスは外部の人々が見ているよりもはるかに複雑だと同氏は考えている。

昨年を例にとると、多数の検索アルゴリズム改善案のうち、41,831件について必要性が評価され、そのうち9,250件について小規模実験が行われ、7,363件についてオンライン実験が行われ、最終的に520件以上の改善が実施されました。ホフマン氏は、アルゴリズムの改善に対する Google のアプローチを、データ駆動型および実験的評価と要約しました。

Google 検索では、平均して常時 200 件以上の実験が実行されており、評価プロセスでは統計モデルと複数の言語の独立した評価者の両方が使用されます。

ホフマン氏は、Googleの検索アルゴリズムの最近の主な改善点は3つの側面にまとめられると述べた。

鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、場合によっては Google はユーザーに最適な検索結果を提供する必要があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。

·高品質ウェブサイトのアルゴリズムの調整:これは、独自の情報、研究と調査、詳細なレポート、正確な分析などを含む高品質ウェブサイトに非常に有益であり、検索結果でのランキングを向上させます。

ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

さらに、Google は、ソーシャル、モバイル、位置情報などの情報要素をさらに検索に統合する予定です。これにより、一方では検索結果がよりパーソナライズされるようになりますが、同時に Google にとって新たな課題も生じます。それは、ますますパーソナライズされる検索結果をどのように測定し、改善するかということです。これまでの実験方法を調整する必要があります。

ホフマン氏は、パーソナライゼーションの影響をより受けやすい要素については、Google はより多くのオンライン実験的手法を使用して調査すると説明した。たとえば、ユーザーのジャンプや滞在時間を調べ、統計モデルを通じて関連データを分析および判断します。また、評価者の個人情報は許可を得て取得し、検索結果の向上に役立てています。

「アルゴリズム改善のための新しいアイデアは、問題を解決するときによく生まれる」とホフマン氏は述べ、グーグルは検索アルゴリズムの開発に1,000人年以上を費やしてきたと付け加えた。

<<:  Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

>>:  Google のアルゴリズムが明らかに: 検索リクエストは平均 2,400 キロメートル往復移動します

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

科学者たちは、脳波を3%という低いエラー率で直接テキストに変換する「心を読む」方法を開発した。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

2020 Forrester Wave レポート: Dynatrace が AI を活用した IT 運用 (AIOps) のリーダーに選出

「Forrester Wave™: IT 運用のための人工知能、2020 年第 4 四半期」レポート...

自動運転の4つの主要技術の簡単な分析

2017年5月に世界保健機関が発表したデータによると、世界中で毎年約125万人が交通事故で亡くなって...

Google、機械学習を使用して医療イベントを予測するFHIRプロトコルバッファツールをオープンソース化

先月26日、GoogleはarXivに「電子健康記録のためのスケーラブルで正確なディープラーニング」...

...

李開復のLLaMAに基づく企業モデルだが、テンソル名が異なっており論争を巻き起こしたが、公式の回答が来た。

少し前に、オープンソースのビッグモデル分野に新しいモデル「易」が導入されました。このモデルはコンテキ...

...

MITのロボットは、浸透する無線周波数を使って隠れた物体を感知する

[[391062]]海外メディアの報道によると、世界中の研究者がロボットが周囲の状況をよりよく認識...

人工知能は、新たな技術と産業の変化のトレンドになりつつある

人工知能(AI)は、コンピュータサイエンスの一分野として、1970年代から世界の3大最先端技術の1つ...

IoTが発展するために機械学習が必要な理由

ビッグデータや人工知能などのテクノロジーがもたらす機会と脅威、そしてその将来に対する懸念については、...

多くのライターがChatGPTを著作権侵害で非難した。OpenAI: 著作権の範囲を誤解している

8月31日、OpenAIは今週、原告に数人の作家を含むほぼ同一の集団訴訟2件に応じた。彼らは、Cha...

AIがコンテンツ業界に力を与える: 確実に勝利するのは誰か、流れを変えるのは誰か

[51CTO.comより引用] 近年、AI技術は徐々にコンテンツ業界に浸透し、さまざまなコンテンツプ...

...

中国チームが超伝導において新たな大きな進歩を遂げました! LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

室温超伝導に新たな進歩はありますか?華南理工大学、中南大学、中国電子科技大学の研究者らは12月19日...

生成型AIを学ぶ際の7つの課題

生成 AI は変革の原動力となり、機械が達成できるものの限界を押し広げています。テキストや画像の生成...