Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

3月12日の朝、Googleが検索リクエストを完了するのにかかった時間は1秒未満でしたが、平均往復距離は約2,400キロメートルでした。 Google では、アルゴリズムを改善するために常時 200 件以上のオンライン実験を行っており、アイデアが実装される前に複数のテストに合格する必要があります。パーソナライズされた検索がますます重要になるにつれ、Google アルゴリズムの改善も新たな課題に直面しています。


検索を完了するための基本的なプロセス(画像提供:Google)

公式データによると、Google 検索は 2003 年から現在までに 4,500 億件を超える検索リクエストを受信して​​います。ユーザーが毎日発行する検索リクエストのうち、16~20% がまったく新しいキーワードです。

基本的な検索プロセスは、検索リクエストの送信 -> 送信 -> カテゴリのフィルタリング -> 検索インデックス -> Web ページの選択 -> 結果のランキング -> 結果の表示という手順で構成されます。 Google の説明によれば、リクエストは数千のデータセンターに分散され、キーワードに応じてマッチングされ、結果として得られたデータは数百の指標に基づいてランク付けされるという。

この複雑なプロセスは通常 1 秒以内に完了しますが、平均的な Google 検索キーワードはユーザーのコンピューターとデータ センターの間を約 2,400 キロメートル (1,500 マイル) 移動します。

「Googleは検索の問題を解決したと多くの人が考えているが、Googleの見方では、検索の開発はまだ始まったばかりだ。検索が本だとしたら、Googleは最初の章を書いたばかりだ」と、Googleのエンジニアリングディレクター、スコット・ハフマン氏は検索について語った。Googleの検索アルゴリズムは10年以上にわたって継続的に改良されてきた。

Google の検索結果は毎年約 20 ~ 30% 変化します。ホフマン氏の主な仕事の一つは、Google 検索の品質を評価することだが、そのプロセスは外部の人々が見ているよりもはるかに複雑だと同氏は考えている。

昨年を例にとると、多数の検索アルゴリズム改善案のうち、41,831件について必要性が評価され、そのうち9,250件について小規模実験が行われ、7,363件についてオンライン実験が行われ、最終的に520件以上の改善が実施されました。ホフマン氏は、アルゴリズムの改善に対する Google のアプローチを、データ駆動型および実験的評価と要約しました。

Google 検索では、平均して常時 200 件以上の実験が実行されており、評価プロセスでは統計モデルと複数の言語の独立した評価者の両方が使用されます。

ホフマン氏は、Googleの検索アルゴリズムの最近の主な改善点は3つの側面にまとめられると述べた。

鮮度アルゴリズムの調整: 速報ニュース、定期的に発生する主要なイベント、コンテンツが頻繁に更新されるトピックなど、場合によっては Google はユーザーに最適な検索結果を提供する必要があります。 「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関する最新の結果が表示されます。

·高品質ウェブサイトのアルゴリズムの調整:これは、独自の情報、研究と調査、詳細なレポート、正確な分析などを含む高品質ウェブサイトに非常に有益であり、検索結果でのランキングを向上させます。

ページ レイアウト アルゴリズムの調整: この改善は、ユーザーが検索結果をクリックした後に表示される Web ページのレイアウトに重点を置き、Web ページ情報の豊富さを向上させ、情報を簡単に検索できる Web ページのランキングを向上させます。

さらに、Google は、ソーシャル、モバイル、位置情報などの情報要素をさらに検索に統合する予定です。これにより、一方では検索結果がよりパーソナライズされるようになりますが、同時に Google にとって新たな課題も生じます。それは、ますますパーソナライズされる検索結果をどのように測定し、改善するかということです。これまでの実験方法を調整する必要があります。

ホフマン氏は、パーソナライゼーションの影響をより受けやすい要素については、Google はより多くのオンライン実験的手法を使用して調査すると説明した。たとえば、ユーザーのジャンプや滞在時間を調べ、統計モデルを通じて関連データを分析および判断します。また、評価者の個人情報は許可を得て取得し、検索結果の向上に役立てています。

「アルゴリズム改善のための新しいアイデアは、問題を解決するときによく生まれる」とホフマン氏は述べ、グーグルは検索アルゴリズムの開発に1,000人年以上を費やしてきたと付け加えた。

<<:  Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

>>:  Google のアルゴリズムが明らかに: 検索リクエストは平均 2,400 キロメートル往復移動します

ブログ    
ブログ    
ブログ    

推薦する

UdeskブランドアップグレードWofeng TechnologyはAIコア技術を深化させ、5つの主要製品ラインでトップ1または2戦略を全面的に推進

6月9日、「新AI、新企業サービス、新旅」Wofeng Technologyブランドアップグレードメ...

...

最新の RLHF は言語モデルの「ナンセンス」を救います!微調整効果はChatGPTよりも優れている、と中国の共著者2人が発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

食習慣の変化に伴い、スマートロボットキッチン技術が熱を帯びる

COVID-19パンデミックが続く中、非接触型の食事がますます人気になっています。宅配やテイクアウト...

高速ドローンは森の中を自律的に飛行し、旅の間中独自のルートを計画し、最高時速40キロメートルで飛行する。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2つのセッションが始まります!自動運転とスマートカーに関する最新の提案13選

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

Python による画像前処理の完全ガイド

機械学習やコンピューター ビジョンのプロジェクトで、画像の品質が低いという問題に遭遇したことはありま...

パフォーマンスが20%向上しました! USTCの「状態シーケンス周波数領域予測」手法:学習サンプル効率の最大化の特徴

強化学習 (RL) アルゴリズムのトレーニング プロセスでは、サポートとして環境との相互作用のサンプ...

...

文字列マッチングのためのKMPアルゴリズム

文字列の照合は、コンピューターの基本的なタスクの 1 つです。たとえば、「BBC ABCDAB AB...

劉強東:AIは今後20年間ですべての産業を変革する中核的な力となる

1956年にアメリカのダートマス大学で開催された学術会議が、世界的なAI研究の始まりとなりました。 ...

鶏が先か卵が先か: ニューラルアーキテクチャ探索手法の概要

Google のプログレッシブ アーキテクチャ検索から CMU の微分化可能アーキテクチャ検索まで、...

チンチラの死: 十分に訓練すれば小型モデルでも大型モデルを上回る性能を発揮できる

2022年3月、DeepMindの論文「計算最適化大規模言語モデルのトレーニング」では、構築されたC...

5G の商用化が加速しています。これはドローンにとって何を意味するのでしょうか?

今年に入ってから、わが国の5G開発は加速しており、各地の5G建設は設定された目標を完了し、5G商用化...