Googleは現在、コア検索アルゴリズムに変更を加えており、検索結果の最大10分の1のランキングに影響を及ぼす可能性がある。 Googleは検索アルゴリズムをどのように変更するのか?Googleがアルゴリズムを変更する技術について、原理を変えずに関連記事を引用しまとめました。
この変更は、Google の研究者が開発し、10 か月前に同社の検索製品に適用された最先端の自然言語処理技術 (NLP) に基づいていると報告されています。 Google は、文章中の単語同士の関係をよりよく理解することで検索結果を改善できると主張している。以前、Google はプレスリリースで、検索アルゴリズムが「薬局で誰かのために薬を入手できますか?」というフレーズの意味を解析できた例について説明しました。 Googleの研究者で検索担当副社長のパンドゥ・ナヤック氏は、古いGoogleの検索アルゴリズムは文章を「言葉の集まり」として扱っていたと述べた。そのため、重要な単語、つまり「薬」と「薬局」に注目し、単純にローカルな結果を返します。新しいアルゴリズムは、「誰かのために」という単語の文脈を理解し、これが誰かから処方箋をもらえるかどうかについての質問であることを認識し、正しい結果を返すことができます。 調整されたアルゴリズムは、BERT (Bidirectional Encoder Representations from Transformers) に基づいていると理解されています。BERT は、「Bidirectional Encoder Representations from Transformers」を意味します。重要なのは、BERT は文を「単語の集まり」として扱うのではなく、文全体のすべての単語を見て、「for someone」が文の意味にとって重要であり省略できないことを認識できることです。 BERT がこれらの単語に気づくことを自ら学習することは注目に値します。 Google は英語の文章のコーパスを収集し、単語の 15% をランダムに削除し、削除された単語が何であるかを判断するために BERT を設定しました。これに対して、上級研究員兼研究担当上級副社長のジェフ・ディーン氏は、時間の経過とともに、このトレーニングによりNLPモデルはコンテキストを理解する上でより効果的になるだろうと述べた。 さらに、Google は「縁石のない坂道に駐車する」という別の例も挙げています。 「no」という単語は文章クエリにとって非常に重要ですが、BRET アルゴリズムを実装する前の Google アルゴリズムではこれが無視されていました。 Googleは、過去数日間で、米国の英語検索クエリの10%に影響を与える新しいアルゴリズムを導入したと述べた(他の言語や国については現時点では議論されていない)。 Leifeng.com は、検索結果を確実に改善するために、検索に対するすべての変更は一連のテストを受ける必要があることを知りました。こうしたテストの中には、Google のアルゴリズムを訓練するために、Google の多数の人間のレビュー担当者を使って検索結果の品質を評価するテストもある。それだけでなく、Google はライブ A テストとライブ B テストも実施しました。 すべてのクエリが BERT の影響を受けるわけではないことを理解することが重要です。BERT は、Google が検索結果のランク付けに使用するさまざまなツールの最新のものにすぎません。彼らがどのように協力しているのかは謎のままです。実際、Google は、システムを不正に操作してスパムを送信するのを防ぐために、これらのプロセスの一部を意図的に秘密にしています。 そして、もう 1 つ重要な理由があります。コンピューターが機械学習を使用して決定を下す場合、なぜその選択を行ったのかを知ることは困難です。これは機械学習の「ブラックボックス」問題に関係します。つまり、結果が何らかの点で間違っている場合、その理由を診断することが困難になる可能性があります。 Google は、BERT をアルゴリズムに追加することでバイアスが増大しないように努めてきたと述べた。バイアスは、トレーニング モデルがそもそもバイアスを持つ機械学習でよく見られる問題である。さらに、BERT は英語の文章の膨大なコーパスでトレーニングされており、これには固有のバイアスも含まれているため、これも懸念事項です。 グーグルはまた、少なくとも大手パブリッシャーに関しては、同社のアルゴリズムがトラフィックに大きな変化をもたらすとは予想していないと述べた。実際、Google の検索アルゴリズムに変更があるたびに、ネットワーク全体が注目します。 また、Google の検索ランキングの変更により、一部の企業が現在宙ぶらりん状態になっていることも注目に値します。実際、ウェブトラフィックから収益を得ている人は誰でもこれに注意を払う必要があります。検索結果の品質に関しては、Payak 氏は次のように語っています。
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 |
<<: AI ソフトウェアは教育分野にどのように役立つのでしょうか?
>>: Python でよく使われるアルゴリズム - 貪欲アルゴリズム (別名 greedy algorithm) をご存知ですか?
今日、テクノロジーの巨人とその AI ベースのデジタル プラットフォームおよびソリューションは、世界...
【51CTO天津6月29日】本日、「偉大な知能時代へ向かう」をテーマとする世界知能会議が天津梅江会議...
中国語と英語のバイリンガル音声対話の最初のオープンソース モデルが登場しました。最近、arXivに音...
[[386512]]基本的な紹介リンクリストは順序付きリストですが、メモリ内に次のように保存されま...
[[427475]]導入ディープラーニングによる物体検出、特に顔検出では、解像度が低い、画像がぼやけ...
世界中の企業は、競合他社に対して競争上の優位性を獲得するのに役立つ高度なテクノロジーを常に探していま...
昨年、微博で話題になった動画を覚えている人はどれくらいいるだろうか。『射雁英雄伝』で朱茵娜が演じ...
2021 年 12 月 21 日に arXiv にアップロードされた自動運転のための説明可能な AI...
AIベースの機密情報検出サービスプロバイダーであるText IQのCEO、Apoorv Agarwa...