fastcompany によると、最近登場した 2 つの機械翻訳システムは、人間が翻訳したテキストからの学習教材を必要とせずに、地球上のあらゆる言語の翻訳を自律的に学習できるという、新たなブレークスルーを達成したとのことです。機械翻訳は劇的に進歩しましたが、翻訳者のドロップダウン メニューに自分の言語が表示されないため、その恩恵を享受できない人が地球上にはまだ何億人もいます。 現在、スペインのバスク大学(UPV)とカーネギーメロン大学(CMU)の2つの新しいAIシステムが、この状況をすべて変え、スタートレックのような真の万能翻訳機への扉を開くと期待されています。
これらの新しいシステムの可能性を理解するには、まず現在の機械翻訳がどのように機能するかを理解することが重要です。 現在、機械翻訳の事実上の標準となっているのは Google 翻訳で、アフリカーンス語からズールー語まで、世界のトップ 10 言語 (順に、中国語、スペイン語、英語、ヒンディー語、ベンガル語、ポルトガル語、ロシア語、日本語、ドイツ語、ジャワ語) を含む 103 の言語をカバーしています。 Google のシステムは、人間が監督するニューラル ネットワークを使用して、以前に人間が翻訳した書籍や記事などの並列テキストを比較します。 Google 翻訳は、これらの並列テキストからの大量のデータを比較することで、任意の 2 つの言語間の同等性を学習し、それらの言語間での迅速な変換機能を獲得します。翻訳がおかしくなったり、原文の意味を正確に反映していない場合もありますが、全体的には機能的で、時間の経過とともに改善されています。 Google のアプローチは優れていて効果的です。しかし、残念ながら、どこでも利用できるわけではありません。 その理由は、教師ありトレーニングには長い時間がかかり、多くの教師が必要になるためです。教師の数が非常に多いため、Google はクラウドソーシングを使用しています。また、世界中のすべての言語間の対訳テキストが十分ではないためです。考えてみてください。世界言語の民族学目録によると、地球上には 6,909 の現存する言語があります。そのうち414種は人類の94%が利用しています。 Google 翻訳は 103 言語をカバーしているため、機械翻訳が利用できない言語は 6,806 言語となり、そのうち 311 言語には 100 万人を超える話者がいる。合計すると、少なくとも 8 億人が自動機械翻訳の恩恵を享受できません。 あらゆる言語間で単語や文章を翻訳できるこの2つの新しいシステムは、人間が翻訳した大量の対訳テキストを比較して学習する必要がない。また、監督も必要ありません。代わりに、彼らは教師なし機械学習を使用し、さまざまな言語のランダムなテキストを比較しました。これはどのように作動しますか?言語の単語の分類は似ているため、システムは単語が同等であるかどうかを推測し、この情報を使用して翻訳辞書を構築します。彼らは文の構造を理解し、異なる言語間で翻訳することで推測を評価しました。 UPV の研究者 Mikel Artetxe 氏は次のように説明しています。「中国語の本とアラビア語の本を大量に渡したと想像してください。重複する部分はまったくありません。そして、その人が中国語をアラビア語に翻訳することを学ばなければならないとしたらどうでしょう。それは不可能に思えますよね?」実際、それはあまりにも不可能に思えるため、Microsoft の AI 専門家 Di He (両研究プロジェクトにインスピレーションを与えた人物) は Science 誌に、「コンピューターは人間の監督なしでも翻訳を学習できる」と知って衝撃を受けたと語っています。 1 つの注意点は、このシステムは現在の並列テキスト深層学習システムほど正確ではないということですが、Di He 氏が指摘するように、コンピューターが人間の指示なしにこれらすべての事実を推測できたという事実は、単純に驚くべきことです。 私たちはこの新しい学習方法の表面をほんの少しだけ触れただけです。近い将来、誰とでも相手の母国語で話せるようになる真の万能翻訳機が登場するかもしれない。それはもはやSFの世界の話ではなくなるだろう。 |
>>: ディープラーニングと通常の機械学習の違いは何ですか?
2022年QS世界大学分野別ランキングが発表されました!全体的には、21年前と比べて大きな変化はあり...
[51CTO.comより引用] 2017年7月21日から22日まで、51CTO主催の人工知能をテーマ...
従来、パラメータの数が満たすべき方程式の数より多い場合は常に、パラメータ化されたモデルを使用してデー...
エッジ AI はエッジ人工知能の略称です。IoT システムの次の開発フロンティアです。では、エッジ人...
GPU がディープラーニングを促進したのであれば、今日ではディープラーニングへの欲求はすでに GPU...
マシンビジョンは急速に発展している人工知能の分野です。簡単に言えば、マシンビジョンとは、測定と判断の...
大規模な言語モデルのサポートにより、開発者は多くの新しい機能を実装し、より幅広いアプリケーション シ...
データ注釈は、ディープラーニングプロセスにおいて常に基本的かつ重要な役割を果たしてきました。高品質な...
顔を入れ替えた動画は、DL を悪用した大きな結果です。インターネット上にあなたの写真がある限り、あな...
今日の急速に変化する世界では、私たちが日常生活で処理しなければならないデータとタスクの量は膨大です。...