Google のアルゴリズムが明らかに: 検索リクエストは平均 2,400 キロメートル往復移動します

Google のアルゴリズムが明らかに: 検索リクエストは平均 2,400 キロメートル往復移動します

Google 検索の進化

3月12日のニュース: 世界で最も広く使われている検索エンジンであるGoogleのアルゴリズムは、常に謎に包まれてきました。最近、Googleエンジニアリングディレクターのスコット・ホフマン氏はテンセントテクノロジーに対し、Googleのアルゴリズムの舞台裏を語り、2011年には520以上の改善があったと語った。2003年から現在までに、Google検索は4500億件の検索リクエストを処理してきた。

スコット・ホフマンは Google に入社して 5 年以上経ち、検索品質評価チームとモバイル検索チームを率いているようです。また、情報検索、機械学習、情報抽出に関する学術論文も数十本執筆しています。15 年以上検索分野に注力しており、Google アルゴリズムに大きな発言力を持っています。

スコット氏は、10年前の検索は単にキーワードをその意味や文脈と一致させることだったかもしれないが、現在ではGoogleは単に表面的に単語を一致させるのではなく、ユーザーが何を望んでいるのかをよりよく理解していると述べた。検索エンジンがユーザーに対して提示する結果は単純に見えるかもしれませんが、実際にはその背後には一連の複雑なプロセスがあり、1秒以内に完了します。 「Google は通常、検索リクエストに応答するのにわずか 0.25 秒しかかかりませんが、人間の目が瞬きする平均的な時間は 0.1 秒です。」

Google アルゴリズムの原理

Google のアルゴリズムの原理について語るスコット氏は、最も基本的な概念はインデックス作成であり、つまり、Google の検索ロボットが数十億の Web ページをスキャンまたは検索してインデックスを作成し、インデックス ライブラリをいくつかの部分に分割して数千台のコンピューターに配置し、世界中のデータ センターにコピーすることで、Google が世界中で検索タスクを完了できるようにすることだと述べました。

Google のアルゴリズムのプロセスは、ユーザーが検索リクエストを送信するというものです。ユーザーの特定の地理的位置に基づいて、Google は世界中のデータ センターに検索リクエストを送信します。その後、データ センターはリクエストを数千台のコンピューターに配信し、ディレクトリとユーザーのリクエスト内のキーワードを照合して、正しいメールまたは Web ページを見つけます。 Google は、最も関連性の高い最新のデータ、つまり検索結果を選択し、さまざまな属性と指標に従ってこれらの検索結果をランク付けして、一致する最も適切な検索エンジンの結果を決定します。平均すると、Google の検索リクエストはコンピュータとデータセンター間を 750 マイル移動します。

Google は毎年、いくつかの新しいアイデアの必要性評価を行っています。評価後に妥当であると判断された場合、主に独立した評価者を招待して、数百件の検索リクエストに基づく 2 つの結果セットを比較する小規模な実験を行います。1 つは通常の検索方法を使用する基本グループで、もう 1 つは新しいアイデアを使用する比較グループです。 2 つの検索結果セットを比較して、どちらがより関連性が高く、検索品質が高いかを確認します。その後、ユーザーはランダムに選択され、オンラインのリアルタイム実験を通じて新しく考案された体験に参加します。

「Google ユーザーで、Google 検索を頻繁に使用している場合、気付かないうちにオンライン実験に参加している可能性があり、表示される検索結果は新しく考案された方法の結果である可能性があります。Google では、常時 200 件を超えるライブ実験がオンラインで実行されています。」

Google アルゴリズムの検索エクスペリエンスを向上させる 3 つのステップ

これらの実験を通じて、Google は検索結果からスパムを削除したり、ユーザーのニーズに基づいて検索インターフェースに表示される結果の数を変更したり、異なる地域で同じ単語を検索したときに異なる結果を表示したりするなど、ユーザーの検索エクスペリエンスを継続的に改善することができます。スコット氏は、Google が 2011 年に 41,931 件の必要性評価、9,250 件の小規模試験、7,363 件のオンラインリアルタイム実験を実施し、最終的に 520 件以上の改善を完了したことを明らかにした。

Google検索ランキング

スコット氏は、Google は検索リクエストごとに異なる測定指標を使用していると指摘した。たとえば、ある病気の問題を調べるとき、ユーザーはその病気について書かれたブログではなく、その Web ページの信頼性に最も注目する。このような検索状況では、Web ページの権限が最も重視されます。さらに、検索の関連性は地域の場所と時間にも関係します。たとえば、ユーザーが北京にいる場合、上海のレストランを検索してもあまり意味がありません。たとえば、大きなイベントを検索する場合、大きなイベントの翌日に得られた検索結果は、その前日に得られた検索結果とはまったく異なることがわかります。

スコット氏によると、Googleの検索アルゴリズムは、鮮度アルゴリズム、ウェブサイト品質アルゴリズム、ページレイアウトアルゴリズムの調整を含む一連の大きな改良を経てきた。その中でも、鮮度アルゴリズムの調整は、速報ニュース、定期的に発生する大きな出来事、頻繁にコンテンツが更新されるトピックなど、場合によってはGoogleがユーザーに最新の検索結果を提供する必要があることを意味する。ユーザーが「オリンピック」を検索すると、1984 年のオリンピックに関する古い情報ではなく、今後開催されるロンドン オリンピックに関連する最新の結果が表示されます。

高品質ウェブサイトのアルゴリズム調整は、独自の情報、研究と調査、詳細なレポート、正確な分析などを含む高品質ウェブサイトに非常に有益であり、検索結果でのランキングが向上します。ページレイアウトアルゴリズムの調整は、ユーザーが検索結果をクリックした後に表示されるウェブページのレイアウトに重点を置き、ウェブページの情報の豊富さを向上させ、情報を簡単に検索できるウェブページのランキングを向上させます。

スコット氏は、FacebookやTwitterなどのソーシャルネットワーキングサイトが発展するにつれて、パーソナライズされた検索結果がますます重要になるだろうと述べた。近年、Google は Google+ などの製品を立ち上げており、これも検索にソーシャル要素を取り入れています。 Googleとしては、今後もソーシャルメディア情報の統合を進めていく。

オリジナルリンク: http://tech.qq.com/a/20120312/000083.htm

【編集者のおすすめ】

  1. 再帰アルゴリズムと最適化アルゴリズムの比較
  2. 簡単なアルゴリズムからアセンブリ言語の予備的研究
  3. ソートアルゴリズムを簡単に学ぶ: よく使われるソートアルゴリズムを視覚的に体験
  4. マット・カッツのブログ投稿: Google のアルゴリズムの最新の変更点 10 件
  5. XML暗号化アルゴリズムが解読され、W3C標準が改訂される

<<:  Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

>>:  Java 実装と読み取り/書き込みロック アルゴリズムの考え方

ブログ    
ブログ    

推薦する

業界のハイエンド複合AI人材を育成するために、第5回AICAチーフAIアーキテクトトレーニングプログラムが開始されました。

10月15日、国家深層学習技術応用工学研究所と百度が共同で開始した第5回AICAチーフAIアーキテ...

AI による IoT センサー電力の管理

[[352688]]センサーの電源喪失は IoT の悩みの種です。数百万個のセンサーを導入しても、そ...

理解を助ける7種類の人工知能

[[269361]] [51CTO.com クイック翻訳] 人工知能は、これまでで最も驚くべきイノベ...

人工知能に対する期待と不安

AI は世界を変えようとしていますが、問題は、それがどのように起こるか誰も予測できないことです。過去...

...

海外メディア:科学者らが深海を探索できる魚のようなソフトロボットを設計

3月4日のニュース、外国メディアの報道によると、ネイチャー誌に最近発表された研究によると、中国のエン...

スマートシティ開発:廃棄物管理と大気質監視

廃棄物管理と空気質監視におけるスマートシティの進歩を通じて、都市生活の未来を探ります。 「スマート ...

気温を下げて干ばつを緩和するブラックテクノロジーが多数存在します。人工降雨の謎とは?

​最近、浙江省の高温が話題になっています。継続的な高温と干ばつの悪影響を緩和するために、浙江省の多く...

速報です!李菲菲の一番弟子カルパシーが辞任、テスラの自動運転は危機に瀕しているのか?

たった今、テスラはまた別の技術専門家を失いました!テスラAIのシニアディレクターであり、自動運転ビジ...

...

フラッシュは廃止されるが、5G時代の新技術は過去を思い出す暇を与えないだろう

Adobe が 2020 年 12 月 31 日をもって有名な Flash ソフトウェアのサポートを...

スマート農業は収穫アシスタントとなる新しいアップグレードロボットを歓迎する

「農業」は国家の基盤です。基盤がしっかりしていれば国家は平和になります。農業は国民経済の建設と発展を...

IoTとAIがコロナウイルスの流行中に企業の事業再開をどのように可能にしているか

[[333668]]数か月に及ぶ極度の不確実性、経済の閉鎖、孤立の後、ようやくゆっくりと経済が機能し...

...

世界はとても広い。AIがあなたと一緒に世界を旅します

[オリジナル記事は51CTO.comより] 私の周りには、「世界は広いから、外に出て旅をしたい」と言...