AIは地球上のあらゆる言語を翻訳できるよう自ら学習できる

AIは地球上のあらゆる言語を翻訳できるよう自ら学習できる

fastcompany によると、最近登場した 2 つの機械翻訳システムは、人間が翻訳したテキストからの学習教材を必要とせずに、地球上のあらゆる言語の翻訳を自律的に学習できるという、新たなブレークスルーを達成したとのことです。機械翻訳は劇的に進歩しましたが、翻訳者のドロップダウン メニューに自分の言語が表示されないため、その恩恵を享受できない人が地球上にはまだ何億人もいます。

現在、スペインのバスク大学(UPV)とカーネギーメロン大学(CMU)の2つの新しいAIシステムが、この状況をすべて変え、スタートレックのような真の万能翻訳機への扉を開くと期待されています。

[[212151]]

これらの新しいシステムの可能性を理解するには、まず現在の機械翻訳がどのように機能するかを理解することが重要です。 現在、機械翻訳の事実上の標準となっているのは Google 翻訳で、アフリカーンス語からズールー語まで、世界のトップ 10 言語 (順に、中国語、スペイン語、英語、ヒンディー語、ベンガル語、ポルトガル語、ロシア語、日本語、ドイツ語、ジャワ語) を含む 103 の言語をカバーしています。

Google のシステムは、人間が監督するニューラル ネットワークを使用して、以前に人間が翻訳した書籍や記事などの並列テキストを比較します。 Google 翻訳は、これらの並列テキストからの大量のデータを比較することで、任意の 2 つの言語間の同等性を学習し、それらの言語間での迅速な変換機能を獲得します。翻訳がおかしくなったり、原文の意味を正確に反映していない場合もありますが、全体的には機能的で、時間の経過とともに改善されています。

Google のアプローチは優れていて効果的です。しかし、残念ながら、どこでも利用できるわけではありません。

その理由は、教師ありトレーニングには長い時間がかかり、多くの教師が必要になるためです。教師の数が非常に多いため、Google はクラウドソーシングを使用しています。また、世界中のすべての言語間の対訳テキストが十分ではないためです。考えてみてください。世界言語の民族学目録によると、地球上には 6,909 の現存する言語があります。そのうち414種は人類の94%が利用しています。 Google 翻訳は 103 言語をカバーしているため、機械翻訳が利用できない言語は 6,806 言語となり、そのうち 311 言語には 100 万人を超える話者がいる。合計すると、少なくとも 8 億人が自動機械翻訳の恩恵を享受できません。

あらゆる言語間で単語や文章を翻訳できるこの2つの新しいシステムは、人間が翻訳した大量の対訳テキストを比較して学習する必要がない。また、監督も必要ありません。代わりに、彼らは教師なし機械学習を使用し、さまざまな言語のランダムなテキストを比較しました。これはどのように作動しますか?言語の単語の分類は似ているため、システムは単語が同等であるかどうかを推測し、この情報を使用して翻訳辞書を構築します。彼らは文の構造を理解し、異なる言語間で翻訳することで推測を評価しました。

UPV の研究者 Mikel Artetxe 氏は次のように説明しています。「中国語の本とアラビア語の本を大量に渡したと想像してください。重複する部分はまったくありません。そして、その人が中国語をアラビア語に翻訳することを学ばなければならないとしたらどうでしょう。それは不可能に思えますよね?」実際、それはあまりにも不可能に思えるため、Microsoft の AI 専門家 Di He (両研究プロジェクトにインスピレーションを与えた人物) は Science 誌に、「コンピューターは人間の監督なしでも翻訳を学習できる」と知って衝撃を受けたと語っています。

1 つの注意点は、このシステムは現在の並列テキスト深層学習システムほど正確ではないということですが、Di He 氏が指摘するように、コンピューターが人間の指示なしにこれらすべての事実を推測できたという事実は、単純に驚くべきことです。 私たちはこの新しい学習方法の表面をほんの少しだけ触れただけです。近い将来、誰とでも相手の母国語で話せるようになる真の万能翻訳機が登場するかもしれない。それはもはやSFの世界の話ではなくなるだろう。

<<:  JavaScript による機械学習の例 10 選

>>:  ディープラーニングと通常の機械学習の違いは何ですか?

ブログ    
ブログ    

推薦する

効率的なトランスフォーマーが次々と登場、Googleチームが1つの記事ですべてをレビュー

Transformerモデルは2017年の誕生以来、自然言語処理やコンピュータービジョンなど多くの分...

IDC: 2024年までにIoTシステムの約20%が人工知能をサポートすると予想

1月20日、IDCが最近発表した「IDC FutureScape:世界の人工知能(AI)と自動化市場...

...

クアルコム副社長ライナー・クレメント氏:「5G+AI+クラウド」は将来の産業をどのように変えるのでしょうか?

2019年国際産業インターネット革新・開発フォーラムがこのほど、第2回中国国際輸入博覧会で開催され...

レオナルド・ダ・ヴィンチに私の肖像画を描いてもらいました! Google の新しいテクノロジーにより、ワンクリックでクラシックが復活

レオナルド・ダ・ヴィンチ、ルーベンス、アンディ・ウォーホルが描いた自分の肖像画をもらったらどんなだろ...

EUがAIを活用して社会イノベーションを推進する方法

2020年の新型コロナウイルスの世界的な蔓延は、人類にとって永遠の記憶となることは間違いないだろう。...

汎用人工知能 (AGI) までどれくらい遠いのでしょうか?

人工知能 (AI) は、今日のテクノロジーにおいて最も注目され、最も影響力のあるトピックの 1 つで...

国立国防技術大学は、モバイル環境下で高精度のオンラインRGB-D再構成を実現するROSEFusionを提案

最近、国立国防科技大学の徐凱教授のチームは、高速移動に対するランダム最適化に基づくオンライン RGB...

AIが書いたコンテンツは判別が難しく、言語の専門家でさえ無力である

9月10日のニュース、2023年は人工知能の年です。チャットボットChatGPTから、グラミー賞に参...

PythonコードからAPPまで、必要なのは小さなツールだけ:GitHubには3,000以上のスターがある

機械学習開発者にとってアプリを構築するのはどれくらい難しいのでしょうか?実際、Python コードを...

科学記事:強化学習後、ロボット学習のボトルネックをどう突破するのか?

[[340407]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...

描いた場所に画像が動きます! Gen-2の新機能「マジックブラシ馬良」が大ヒット、ネットユーザー:緊急、緊急、緊急

動画生成AIはここまで進化したのか? !写真をスワイプするだけで、選択したターゲットが動きます。明ら...

会話型AIが発展途上国の経済をどう変えるか

テクノロジーは商品の売買方法を変えました。電子商取引の発展により、トレーダーは世界中のほぼどこでも、...