Google翻訳カーネルのアップグレードによりエラー率が55%以上低下したと主張

Google翻訳カーネルのアップグレードによりエラー率が55%以上低下したと主張

最近、Google 翻訳はひっそりと翻訳コアをアップグレードしました。 Google が提供する公式データによると、Google 翻訳で使用されている Google ニューラル マシン トランスレーション (GNMT) システムは、現在利用可能な最も高度なトレーニング テクノロジを使用しており、これにより機械翻訳のレベルが向上し、翻訳エラーがさらに 55%~85% 削減されます。

Googleの翻訳モデルの品質

10 年以上前、Google は Google 翻訳をリリースしました。初期の頃は、フレーズベースの統計的機械翻訳によって、入力された文章が単語やフレーズに分解され、個別に翻訳されていました。この翻訳方法の欠点は非常に明白です。文中の元々完全な情報が断片化され、首尾一貫して表現できないのです。この現象は、英語と中国語間の翻訳において特に顕著です。

一方、Google ニューラル機械翻訳は、入力された文全体を翻訳します。

中国語から英語への翻訳を例にとると、Google ニューラル機械翻訳はまずこの中国語の文章内の単語をベクトルのリストにエンコードします。各ベクトルは、これまでに読み取られたすべての単語の意味を表します (エンコーダー)。文章全体を読み終えると、デコーダーが動作を開始し、英語の文章を 1 単語ずつ生成します (デコーダー)。

上図はGoogleニューラル機械翻訳の中国語-英語翻訳原理を示している。

各ステップで正しい翻訳された単語を生成するために、デコーダーは、生成された英語の単語に最も関連性の高い中国語ベクトルの重み分布に焦点を当てます。

最初に提案されたとき、ニューラル機械翻訳システムは、中規模のデータセットではフレーズベースの翻訳システムに匹敵するものでした。

Google は現在、ニューラル機械翻訳によって非常に大規模なデータセットを扱う際の多くの課題を克服し、より高速かつより正確に翻訳できるシステムを構築したと発表している。

現在、中国語から英語への翻訳にはGoogleのニューラル機械翻訳システムが利用されています。 Google 翻訳は現在、モバイルとウェブ上での中国語から英語への翻訳にニューラル機械翻訳を使用しており、1 日あたり約 1,800 万件の翻訳が行われています。

大規模なデータセットでテストされた Google のニューラル機械翻訳システムを搭載した最新の Google 翻訳は、どれほど効果的なのでしょうか?

簡単な比較テストを行いました。もちろん、これはまだ中国語から英語への翻訳のシナリオです。

テストシナリオ: PC側Google翻訳ウェブバージョン

英語のメッセージがランダムに選択され、元のテキストは次のとおりです。

COVID-19 が始まって以来、小売業やブランド製造業のパートナーからは、消費者の需要の変動を踏まえ、消費者の関心がどのように変化しているかについて、より詳しい情報を求めているという声が寄せられています。こうした変化は、Google での検索方法に反映されています。先月は、人々が自宅で過ごす時間が増えたため、家庭用品やジグソーパズルの検索関心が急増しました。今月は、米国ではミシンやベーキング用品、英国とオーストラリアではテザーボール セットやチョークへの関心が急増しました。

企業は、Google トレンド、ソーシャル リスニング、アンケート、自社データなど、さまざまなリソースを活用して消費者の関心の変化を把握し、即座に意思決定を行っています。しかし、何を探せばよいかがわからなければ、どの製品カテゴリが人気を集めているのか、またそれがチャンスとなる可能性があるのか​​を簡単には理解できません。

そのため、Think with Google で急成長中の小売カテゴリ ツールをリリースします。このツールは、Google 検索で急成長している商品関連カテゴリ、そのカテゴリが成長している場所、関連する検索語句を表示します。人々が検索している商品カテゴリに関するこのような分析情報を提供するのは今回が初めてです。

Google 翻訳の旧バージョンによる英語 - 中国語の翻訳結果:

アップグレード後の Google 翻訳による新しい英語 - 中国語翻訳結果。赤でマークされた部分は、以前の翻訳結果と異なります。新しい翻訳は次のとおりです。

2つの翻訳結果を比較すると、大きな違いがあることがわかります。全体的に、新しい翻訳結果で赤でマークされた表現は、明らかに中国語の文法や表現習慣に沿っています。

さらに、最後の段落の翻訳結果の最適化がより顕著になり、Google の製品名「Think with Google」が正確に識別され、ランダム翻訳の恥ずかしさが回避されました。

確かに賢いですね!

<<:  プロセス産業におけるグリーン製造における人工知能の機会と課題

>>:  IoT、AI、ブロックチェーンがビジネス経済を変革する

ブログ    
ブログ    
ブログ    

推薦する

...

人工知能と機械学習とデータ分析の違いは何ですか?

調査によると、人工知能はビジネスの生産性を 54% 向上させることができます。さらに、15% の組織...

ワクチン生産を加速するには?答えは医学ではなくテクノロジーにある

世界各国の政府は新型コロナウイルス感染症の流行に対抗するためさまざまな対策を講じているが、世界的な流...

Newbingが他の生成AIと大きく異なる理由

Newbing を使い始めてから、CHATGPT 3.5 を諦めました。昨日記事を書いた後、Chat...

WOT2018 Xian Yunsen: O2O検索にはアルゴリズムがあふれている

[51CTO.com からのオリジナル記事] 7 年間の努力と見事な変貌。 2012年以降、6年連続...

...

人工知能はまだ長い道のりを歩んでいる

過去2年間で、「スマートホーム」はほぼすべての家電メーカーが必ず話題にし、自社製品になくてはならない...

「乾物」テイクアウト注文に8大AI配送・配分内部機構搭載、元気いっぱい!

過去2年間、テイクアウトの市場規模は驚異的なペースで成長を続けています。美団の最近のフードデリバリー...

...

国家基準の策定が加速しており、科学的な顔認識は100億元のブルーオーシャンをもたらすだろう

4月22日、「情報セキュリティ技術の顔認識データのセキュリティ要件」国家標準の草案が正式に公開され、...

マイクロソフトアジアリサーチは、知識蒸留を使用して小さなViTを改善するTinyMIMを提案

1. 研究の動機マスクモデリング (MIM、MAE) は、非常に効果的な自己教師ありトレーニング方法...

...

クイックソートアルゴリズムの普及チュートリアル

[[121950]]多くは語りません。次に、この記事の主題であるソートアルゴリズムについて説明しまし...