Microsoft Translator は 100 を突破し、チベット語、ウイグル語など 12 の新しい言語/方言のサポートを追加しました...

Microsoft Translator は 100 を突破し、チベット語、ウイグル語など 12 の新しい言語/方言のサポートを追加しました...

IT Homeは10月12日、Microsoft Translatorが本日、12の新しい言語と方言をサポートすると発表したと報じた。このサポートにより、Microsoft Translator は現在合計 103 の言語をサポートし、世界人口の 72% をカバーしています。このリリースにより、Microsoft Translator はテキストやドキュメントを世界中の 56 億 6 千万人の母国語に翻訳できるようになります。

IT Home は、Microsoft Translator に新しく追加された言語が、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語 (キリル文字)、モンゴル語 (繁体字版)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語 (ラテン文字) であることを知りました。これらの新しい言語を話す人は8,460万人です。

「100 の言語は、あらゆる人がどんな言語を話す人でもコミュニケーションできるようにするという私たちの目標の達成に向けた大きなマイルストーンです」と、マイクロソフトのテクニカル フェロー兼 Azure AI CTO である Xuedong Huang 氏は述べています。

Microsoft Translatorの進化

Microsoft Research は 20 年以上前に初めて機械翻訳システムを開発しました。 2003 年、機械翻訳システムにより、Microsoft Knowledge Base 全体が英語からスペイン語、フランス語、ドイツ語、日本語に翻訳され、その翻訳が Web サイトで公開されました。これは、当時インターネット上で最大規模の公開型機械翻訳アプリケーションとなりました。

Microsoft は、統計的機械翻訳 (SMT) モデルに基づいてこれらのシステムをさらに開発し、Windows Live Translator、Translator API、および Microsoft Office アプリケーションの組み込み機能を通じて一般に公開しました。

マイクロソフトは、長年にわたり、世界で最も一般的に使用されている言語の多くに翻訳システムを追加してきたと述べた。マイクロソフトは、人工知能 (AI) 技術の発展に伴い、ニューラル機械翻訳 (NMT) 技術を採用し、すべての機械翻訳システムを Transformer 技術に基づくニューラル モデルに移行し、翻訳の流暢性と正確性の大幅な向上を実現しました。

NMT テクノロジーによって翻訳全体の品質が大幅に向上しましたが、Transformer アーキテクチャの登場により、以前よりも少ない材料でトレーニングできる機械翻訳モデルを作成するための新しい方法が生まれました。多言語 Transformer アーキテクチャを使用すると、多くの場合同じ言語ファミリーまたは関連言語ファミリー内の他の言語の資料を使用してトレーニング データを拡張し、データが少ない言語 (多くの場合、低リソース言語と呼ばれる) のモデルを作成できるようになりました。

これらのテクノロジーを使用しても、ターゲット言語のデジタル ファイルのセットと、それに含まれる別の言語の翻訳 (パラレル ファイルと呼ばれることが多い) が必要です。

▲ Microsoft Translator で翻訳された言語の数の折れ線グラフ。2007 年の 7 言語から 2021 年には 100 言語以上に増加しています。このシステムは2007年から2016年まで統計的機械翻訳(SMT)を使用していました。 2016 年にニューラル機械翻訳 (NMT) テクノロジを採用したことで翻訳品質が向上し、2019 年に Transformer アーキテクチャを採用したことで、Microsoft チームはより少ないデータでリソースの少ない言語のモデルを構築できるようになりました。

マイクロソフトは、新しい言語を追加する場合の最大の課題の 1 つは、機械翻訳モデルのトレーニングと構築に必要な十分なバイリンガル データを取得することだと述べています。このデータは、追加する言語と、サービスが既にサポートしている言語の両方について、人間が翻訳した高品質のコンテンツで構成されています。多くの言語では、特にデジタルリソースが不足している言語や消滅の危機に瀕している言語の場合、このようなバイリンガルデータを入手するのは困難です。

マイクロソフトは、人間が翻訳したテキストにアクセスでき、リソースが不足している言語のデータ収集に貢献できる言語コミュニティのパートナーと協力できることは幸運だと述べている。これらのコミュニティ パートナーは、多くの場合、それぞれのコミュニティで活動しているボランティアであり、コミュニティのメンバーと相談しながら、バイリンガルの文章を収集する手間を惜しみません。次に、得られた機械翻訳モデルの品質を評価しました。

[[428381]]

Azure Cognitive Services Translator は、テキスト翻訳 API およびドキュメント翻訳 API を通じて、Microsoft 製品および翻訳顧客に NMT モデルを公開します。これらの API は、プレーンテキストと複雑なファイルをある言語から別の言語に変換します。 Azure Cognitive Services Translator API は、パブリック クラウドと安全な Microsoft Azure Government クラウドで利用できます。さらに、テキスト翻訳 API は Docker コンテナで利用できるため、顧客は企業内でコンテンツを処理して特定の規制要件を満たすことができます。

Azure Cognitive Services Translator には、Custom Translator サービスも含まれています。これにより、ユーザーは独自の翻訳メモリを使用してカスタム機械翻訳モデルを構築し、ビジネスや関連業界で使用されるドメイン固有の用語を翻訳できます。これらのカスタム機械翻訳モデルは、テキストおよびドキュメント翻訳 API を通じて使用できます。

オーディオまたは音声コンテンツを翻訳するために、Azure Cognitive Services Translation は Azure Cognitive Services Speech と緊密に統合されており、Azure Speech SDK を通じて音声翻訳とマルチデバイス会話をサポートします。

Azure Cognitive Services Translator とそれがサポートする製品は、顧客に広く採用されています。このサービスは多くの Microsoft 製品にシームレスに統合されており、誰でも簡単に使用でき、選択した言語でコンテンツを作成できます。 Microsoft 製品の統合には、テキストとファイルの翻訳用の Microsoft 365、Web ページ全体を翻訳するための Microsoft Edge ブラウザー、メッセージの翻訳用の SwiftKey、ユーザーが送信したコンテンツの翻訳用の LinkedIn、外出先での多言語会話用の Translator アプリなどがあります。

<<:  人工知能の時代:知識を活用して人間関係を変える

>>:  人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?

ブログ    

推薦する

DeepSpeed ZeRO++: ネットワーク通信を4倍削減し、大規模モデルやChatGPTのようなモデルのトレーニング効率を大幅に向上

大規模な AI モデルがデジタルの世界を変えています。大規模言語モデル (LLM) に基づく Tur...

...

開発速度が20倍にアップしました! GPT Pilot スター プロジェクトが Github のホット リストに掲載され、AI をゼロから構築

新たなスタープロジェクトが誕生! AI 開発者コンパニオンである GPT Pilot を使用すると、...

DeLu Deep Visionが蘇州スマート博覧会に登場、3Dフルスタックでマシンビジョンの新時代を切り開く

8月14日、2020年世界人工知能製品応用博覧会(AIExpo2020)が予定通り蘇州国際博覧センタ...

ニューラルネットワークに基づくマルウェア検出分析

今日、あらゆる業界にとって、「マルウェアを効果的に検出する方法」は、ネットワーク セキュリティに関す...

論文と新しいビデオはこちら、サウスイースト大学が「室温超伝導体」LK-99の奇妙な抵抗挙動を説明

最近、各国の科学者らが韓国の「常温超伝導」物質LK-99に関する研究を発表し、悲観的な見方をする人が...

...

...

AI を活用した予測分析で物流に革命を起こす

今日の急速に変化する物流の世界では、効率が鍵となります。世界経済は商品の円滑な流れに完全に依存してい...

Ant Marketingの推奨シナリオにおける因果修正法

1. 因果修正の背景1. 逸脱の発生推奨システムは、収集されたデータに基づいて推奨モデルをトレーニン...

年次レビュー:2020 年の 5 つの注目すべきテクノロジー トレンド、時代のトレンドに遅れずについていく

世界の歴史は発明の歴史でもあります。火薬の発明は世界地図を変え、電灯の発明は夜を変え、車の発明は空間...

Gym Anytradingに基づく強化学習の簡単な例

強化学習 (RL) は近年、アルゴリズム取引の分野で大きな注目を集めています。強化学習アルゴリズムは...

3分レビュー! 2021年1月のロボット工学分野の重要な動向の概要

ポスト疫病時代において、国内ロボット市場は急速に発展しました。同時に、国際ロボット分野は前向きな発展...