Facebookの新しいAIモデルは、英語以外の言語から英語以外の言語に直接翻訳できる

Facebookの新しいAIモデルは、英語以外の言語から英語以外の言語に直接翻訳できる

海外メディアの報道によると、機械翻訳技術は誕生以来長い道のりを歩んできた。 Google のような翻訳ツールはかつては粗雑で信頼性が低く、最も基本的な翻訳にしか役立ちませんでしたが、現在では AI の力により信じられないほど正確になっています。しかし、いくつかの古代の翻訳方法はまだ存在しています。 たとえば、Facebook では、まず文章が基本言語から英語に翻訳され、次に英語からターゲット言語に翻訳されます。

これにはいくつかの理由がありますが、その 1 つは、英語以外の言語間の翻訳に役立つ AI トレーニング データが不足していることです。

多くの人が英語からフランス語へ、またはフランス語から英語へ単語やフレーズを翻訳しますが、コンテンツをフランス語からスペイン語へ、またはスペイン語からドイツ語へ翻訳する人ははるかに少ないです。

このため、複雑な言語間の翻訳を理解できるように AI をトレーニングするのは、かなり難しいプロセスになります。しかし、Facebookの最近のブログ投稿によると、このソーシャルメディア大手はついにこの問題に対処し、解決策を思いついたという。

このソリューションは、初の「多言語機械翻訳モデル」である M2M-100 という形で提供されます。このモデルは、英語のデータセットに依存せずに、100 言語の任意のペア間で翻訳できます。モデルは完全にオープンソースなので、その有効性に疑問がある場合は自分で確認することができます。

Facebookは、同社の多言語翻訳モデルは、同社が「英語中心」と呼ぶ翻訳システムよりも理にかなっていると述べている。同社は、M2M-100 は機械翻訳評価の BLEU スケールで他の方法より「10 ポイント」優れていると主張している。

Facebookによれば、このプロジェクトは何年も前から進められており、まだ改善の余地は大きいものの、同社はこれまでの進捗に満足しているという。

M2M-100 が Facebook 上で直接リリースされるかどうか、またリリースされる時期は不明です。

<<:  人工知能:古典コンピュータから量子コンピュータまで、弱い AI は強い AI の時代へ進むのでしょうか?

>>:  [Dry Goods] グラフニューラルネットワークの学習リソーストップ10の共有

ブログ    

推薦する

12 のシナリオ アプリケーション、100 を超えるアルゴリズム、AI はどのようにして経済を征服するのか?

[[328065]] 2020年2月7日、第34回アメリカ人工知能学会年次会議(AAAI 2020...

...

識別的か生成的か: どちらが視覚的理解の未来を表すのでしょうか?

これまで、視覚システムに関する基本的な研究の多くは、動物に画像を見せ、そのニューロンの反応を測定し、...

AI支援農業建築:農業生産効率の向上

科学技術の急速な発展に伴い、人工知能(AI)はさまざまな分野にますます統合されつつあり、農業分野も例...

人工ニューラル ネットワークのドライバー: 活性化関数とは何ですか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

Googleの上級研究員ネイチャーが記事を公開: 機械学習の3つの大きな「落とし穴」を避ける

アルゴリズム分析は科学研究の重要な方法となっている。生物学者、高エネルギー物理学者、病理学者など、多...

アルゴリズムを超えて: 人工知能と機械学習が組織に与える影響

[[319769]]今日、デジタルサイエンスは企業にとってますます魅力的になっています。しかし、デジ...

5 年以内に、8,000 万の仕事が機械に置き換えられるでしょう。インダストリアル インターネットは治療薬でしょうか、それとも毒でしょうか?

時代の発展は常に要求と矛盾の中で発展しています。あらゆる産業革命は発展の力をもたらすだけでなく、大き...

2020年エンタープライズ機械学習市場レポート:7つの調査結果

[[285635]] [51CTO.com クイック翻訳] Algorithmia が最近発表したレ...

人工知能のトレンドが電子商取引業界のビジネスを変える

電子商取引企業は常に技術革新の最前線に立ってきました。彼らでさえ、ビッグデータの突然の驚くべき破壊力...

...

シングルポイントのエンドツーエンドのテキスト検出および認識フレームワークは 19 倍高速です。華中科技大学、華南理工大学などが共同でSPTS v2をリリース

近年、シーンテキスト読み取り(テキストスポッティング)は大きな進歩を遂げており、テキストの検索と認識...

上場企業141社がAIに騙された! Googleは偶然共犯者になる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

SFが現実になる?偉大な劉慈欣がAI企業に入社

[[411067]]サイエンスフィクションと現実がこれほど近づいたことはかつてありませんでした。 「...

スマート病院: 将来の医療技術のガイドラインとトレンド

スマート病院とは何ですか?最も伝統的な病院でさえ、人、プロセス、資産の広大なネットワークを持つ複雑な...