海外メディアの報道によると、機械翻訳技術は誕生以来長い道のりを歩んできた。 Google のような翻訳ツールはかつては粗雑で信頼性が低く、最も基本的な翻訳にしか役立ちませんでしたが、現在では AI の力により信じられないほど正確になっています。しかし、いくつかの古代の翻訳方法はまだ存在しています。 たとえば、Facebook では、まず文章が基本言語から英語に翻訳され、次に英語からターゲット言語に翻訳されます。 これにはいくつかの理由がありますが、その 1 つは、英語以外の言語間の翻訳に役立つ AI トレーニング データが不足していることです。 多くの人が英語からフランス語へ、またはフランス語から英語へ単語やフレーズを翻訳しますが、コンテンツをフランス語からスペイン語へ、またはスペイン語からドイツ語へ翻訳する人ははるかに少ないです。 このため、複雑な言語間の翻訳を理解できるように AI をトレーニングするのは、かなり難しいプロセスになります。しかし、Facebookの最近のブログ投稿によると、このソーシャルメディア大手はついにこの問題に対処し、解決策を思いついたという。 このソリューションは、初の「多言語機械翻訳モデル」である M2M-100 という形で提供されます。このモデルは、英語のデータセットに依存せずに、100 言語の任意のペア間で翻訳できます。モデルは完全にオープンソースなので、その有効性に疑問がある場合は自分で確認することができます。 Facebookは、同社の多言語翻訳モデルは、同社が「英語中心」と呼ぶ翻訳システムよりも理にかなっていると述べている。同社は、M2M-100 は機械翻訳評価の BLEU スケールで他の方法より「10 ポイント」優れていると主張している。 Facebookによれば、このプロジェクトは何年も前から進められており、まだ改善の余地は大きいものの、同社はこれまでの進捗に満足しているという。 M2M-100 が Facebook 上で直接リリースされるかどうか、またリリースされる時期は不明です。 |
<<: 人工知能:古典コンピュータから量子コンピュータまで、弱い AI は強い AI の時代へ進むのでしょうか?
>>: [Dry Goods] グラフニューラルネットワークの学習リソーストップ10の共有
[[328065]] 2020年2月7日、第34回アメリカ人工知能学会年次会議(AAAI 2020...
これまで、視覚システムに関する基本的な研究の多くは、動物に画像を見せ、そのニューロンの反応を測定し、...
科学技術の急速な発展に伴い、人工知能(AI)はさまざまな分野にますます統合されつつあり、農業分野も例...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
アルゴリズム分析は科学研究の重要な方法となっている。生物学者、高エネルギー物理学者、病理学者など、多...
[[319769]]今日、デジタルサイエンスは企業にとってますます魅力的になっています。しかし、デジ...
時代の発展は常に要求と矛盾の中で発展しています。あらゆる産業革命は発展の力をもたらすだけでなく、大き...
[[285635]] [51CTO.com クイック翻訳] Algorithmia が最近発表したレ...
電子商取引企業は常に技術革新の最前線に立ってきました。彼らでさえ、ビッグデータの突然の驚くべき破壊力...
近年、シーンテキスト読み取り(テキストスポッティング)は大きな進歩を遂げており、テキストの検索と認識...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[411067]]サイエンスフィクションと現実がこれほど近づいたことはかつてありませんでした。 「...
スマート病院とは何ですか?最も伝統的な病院でさえ、人、プロセス、資産の広大なネットワークを持つ複雑な...