Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleは現在、コア検索アルゴリズムに変更を加えており、検索結果の最大10分の1のランキングに影響を及ぼす可能性がある。 Googleは検索アルゴリズムをどのように変更するのか?Googleがアルゴリズムを変更する技術について、原理を変えずに関連記事を引用しまとめました。

[[280679]]

【画像出典:THE VERGE オーナー:THE VERGE】

この変更は、Google の研究者が開発し、10 か月前に同社の検索製品に適用された最先端の自然言語処理技術 (NLP) に基づいていると報告されています。 Google は、文章中の単語同士の関係をよりよく理解することで検索結果を改善できると主張している。以前、Google はプレスリリースで、検索アルゴリズムが「薬局で誰かのために薬を入手できますか?」というフレーズの意味を解析できた例について説明しました。

Googleの研究者で検索担当副社長のパンドゥ・ナヤック氏は、古いGoogleの検索アルゴリズムは文章を「言葉の集まり」として扱っていたと述べた。そのため、重要な単語、つまり「薬」と「薬局」に注目し、単純にローカルな結果を返します。新しいアルゴリズムは、「誰かのために」という単語の文脈を理解し、これが誰かから処方箋をもらえるかどうかについての質問であることを認識し、正しい結果を返すことができます。

調整されたアルゴリズムは、BERT (Bidirectional Encoder Representations from Transformers) に基づいていると理解されています。BERT は、「Bidirectional Encoder Representations from Transformers」を意味します。重要なのは、BERT は文を「単語の集まり」として扱うのではなく、文全体のすべての単語を見て、「for someone」が文の意味にとって重要であり省略できないことを認識できることです。

BERT がこれらの単語に気づくことを自ら学習することは注目に値します。 Google は英語の文章のコーパスを収集し、単語の 15% をランダムに削除し、削除された単語が何であるかを判断するために BERT を設定しました。これに対して、上級研究員兼研究担当上級副社長のジェフ・ディーン氏は、時間の経過とともに、このトレーニングによりNLPモデルはコンテキストを理解する上でより効果的になるだろうと述べた。

さらに、Google は「縁石のない坂道に駐車する」という別の例も挙げています。 「no」という単語は文章クエリにとって非常に重要ですが、BRET アルゴリズムを実装する前の Google アルゴリズムではこれが無視されていました。

【画像出典:THE VERGE オーナー:THE VERGE】

Googleは、過去数日間で、米国の英語検索クエリの10%に影響を与える新しいアルゴリズムを導入したと述べた(他の言語や国については現時点では議論されていない)。

Leifeng.com は、検索結果を確実に改善するために、検索に対するすべての変更は一連のテストを受ける必要があることを知りました。こうしたテストの中には、Google のアルゴリズムを訓練するために、Google の多数の人間のレビュー担当者を使って検索結果の品質を評価するテストもある。それだけでなく、Google はライブ A テストとライブ B テストも実施しました。

すべてのクエリが BERT の影響を受けるわけではないことを理解することが重要です。BERT は、Google が検索結果のランク付けに使用するさまざまなツールの最新のものにすぎません。彼らがどのように協力しているのかは謎のままです。実際、Google は、システムを不正に操作してスパムを送信するのを防ぐために、これらのプロセスの一部を意図的に秘密にしています。

そして、もう 1 つ重要な理由があります。コンピューターが機械学習を使用して決定を下す場合、なぜその選択を行ったのかを知ることは困難です。これは機械学習の「ブラックボックス」問題に関係します。つまり、結果が何らかの点で間違っている場合、その理由を診断することが困難になる可能性があります。

Google は、BERT をアルゴリズムに追加することでバイアスが増大しないように努めてきたと述べた。バイアスは、トレーニング モデルがそもそもバイアスを持つ機械学習でよく見られる問題である。さらに、BERT は英語の文章の膨大なコーパスでトレーニングされており、これには固有のバイアスも含まれているため、これも懸念事項です。

グーグルはまた、少なくとも大手パブリッシャーに関しては、同社のアルゴリズムがトラフィックに大きな変化をもたらすとは予想していないと述べた。実際、Google の検索アルゴリズムに変更があるたびに、ネットワーク全体が注目します。

また、Google の検索ランキングの変更により、一部の企業が現在宙ぶらりん状態になっていることも注目に値します。実際、ウェブトラフィックから収益を得ている人は誰でもこれに注意を払う必要があります。検索結果の品質に関しては、Payak 氏は次のように語っています。

  • これが最大の変化です。過去 5 年間で私たちが経験した中で最も前向きな変化であり、おそらく創業以来最大の変化の 1 つでしょう。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

<<:  AI ソフトウェアは教育分野にどのように役立つのでしょうか?

>>:  Python でよく使われるアルゴリズム - 貪欲アルゴリズム (別名 greedy algorithm) をご存知ですか?

ブログ    
ブログ    

推薦する

...

ユーザーエクスペリエンスは過去のものになりました。AIは国民、さらには社会の視点から問題を考える必要があります。

今日、テクノロジーの巨人とその AI ベースのデジタル プラットフォームおよびソリューションは、世界...

世界情報会議が開幕、ロビン・リー、ジャック・マー、劉伝志ら著名人が集結

【51CTO天津6月29日】本日、「偉大な知能時代へ向かう」をテーマとする世界知能会議が天津梅江会議...

...

...

...

国内の音声対話モデルはこちら:Kai-Fu LeeとZero One Everythingが参加、中国語と英語のバイリンガルマルチモーダル、オープンソースで市販されている

中国語と英語のバイリンガル音声対話の最初のオープンソース モデルが登場しました。最近、arXivに音...

...

Java プログラミング スキル - データ構造とアルゴリズム「単方向リンク リスト」

[[386512]]基本的な紹介リンクリストは順序付きリストですが、メモリ内に次のように保存されま...

小さなターゲットを検出するためのディープラーニングの一般的な方法

[[427475]]導入ディープラーニングによる物体検出、特に顔検出では、解像度が低い、画像がぼやけ...

ドローン自動化システムの産業への応用を探る

世界中の企業は、競合他社に対して競争上の優位性を獲得するのに役立つ高度なテクノロジーを常に探していま...

インターネット大手が一斉に禁止、AIによる顔の改造はどこまで可能か?

​​昨年、微博で話題になった動画を覚えている人はどれくらいいるだろうか。『射雁英雄伝』で朱茵娜が演じ...

自動運転における説明可能なAIのレビューと今後の研究の方向性

2021 年 12 月 21 日に arXiv にアップロードされた自動運転のための説明可能な AI...

AIと自動化を活用して機密データを大規模に識別する方法

AIベースの機密情報検出サービスプロバイダーであるText IQのCEO、Apoorv Agarwa...