Microsoft Translator は 100 を突破し、チベット語、ウイグル語など 12 の新しい言語/方言のサポートを追加しました...

Microsoft Translator は 100 を突破し、チベット語、ウイグル語など 12 の新しい言語/方言のサポートを追加しました...

IT Homeは10月12日、Microsoft Translatorが本日、12の新しい言語と方言をサポートすると発表したと報じた。このサポートにより、Microsoft Translator は現在合計 103 の言語をサポートし、世界人口の 72% をカバーしています。このリリースにより、Microsoft Translator はテキストやドキュメントを世界中の 56 億 6 千万人の母国語に翻訳できるようになります。

IT Home は、Microsoft Translator に新しく追加された言語が、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語 (キリル文字)、モンゴル語 (繁体字版)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語 (ラテン文字) であることを知りました。これらの新しい言語を話す人は8,460万人です。

「100 の言語は、あらゆる人がどんな言語を話す人でもコミュニケーションできるようにするという私たちの目標の達成に向けた大きなマイルストーンです」と、マイクロソフトのテクニカル フェロー兼 Azure AI CTO である Xuedong Huang 氏は述べています。

Microsoft Translatorの進化

Microsoft Research は 20 年以上前に初めて機械翻訳システムを開発しました。 2003 年、機械翻訳システムにより、Microsoft Knowledge Base 全体が英語からスペイン語、フランス語、ドイツ語、日本語に翻訳され、その翻訳が Web サイトで公開されました。これは、当時インターネット上で最大規模の公開型機械翻訳アプリケーションとなりました。

Microsoft は、統計的機械翻訳 (SMT) モデルに基づいてこれらのシステムをさらに開発し、Windows Live Translator、Translator API、および Microsoft Office アプリケーションの組み込み機能を通じて一般に公開しました。

マイクロソフトは、長年にわたり、世界で最も一般的に使用されている言語の多くに翻訳システムを追加してきたと述べた。マイクロソフトは、人工知能 (AI) 技術の発展に伴い、ニューラル機械翻訳 (NMT) 技術を採用し、すべての機械翻訳システムを Transformer 技術に基づくニューラル モデルに移行し、翻訳の流暢性と正確性の大幅な向上を実現しました。

NMT テクノロジーによって翻訳全体の品質が大幅に向上しましたが、Transformer アーキテクチャの登場により、以前よりも少ない材料でトレーニングできる機械翻訳モデルを作成するための新しい方法が生まれました。多言語 Transformer アーキテクチャを使用すると、多くの場合同じ言語ファミリーまたは関連言語ファミリー内の他の言語の資料を使用してトレーニング データを拡張し、データが少ない言語 (多くの場合、低リソース言語と呼ばれる) のモデルを作成できるようになりました。

これらのテクノロジーを使用しても、ターゲット言語のデジタル ファイルのセットと、それに含まれる別の言語の翻訳 (パラレル ファイルと呼ばれることが多い) が必要です。

▲ Microsoft Translator で翻訳された言語の数の折れ線グラフ。2007 年の 7 言語から 2021 年には 100 言語以上に増加しています。このシステムは2007年から2016年まで統計的機械翻訳(SMT)を使用していました。 2016 年にニューラル機械翻訳 (NMT) テクノロジを採用したことで翻訳品質が向上し、2019 年に Transformer アーキテクチャを採用したことで、Microsoft チームはより少ないデータでリソースの少ない言語のモデルを構築できるようになりました。

マイクロソフトは、新しい言語を追加する場合の最大の課題の 1 つは、機械翻訳モデルのトレーニングと構築に必要な十分なバイリンガル データを取得することだと述べています。このデータは、追加する言語と、サービスが既にサポートしている言語の両方について、人間が翻訳した高品質のコンテンツで構成されています。多くの言語では、特にデジタルリソースが不足している言語や消滅の危機に瀕している言語の場合、このようなバイリンガルデータを入手するのは困難です。

マイクロソフトは、人間が翻訳したテキストにアクセスでき、リソースが不足している言語のデータ収集に貢献できる言語コミュニティのパートナーと協力できることは幸運だと述べている。これらのコミュニティ パートナーは、多くの場合、それぞれのコミュニティで活動しているボランティアであり、コミュニティのメンバーと相談しながら、バイリンガルの文章を収集する手間を惜しみません。次に、得られた機械翻訳モデルの品質を評価しました。

[[428381]]

Azure Cognitive Services Translator は、テキスト翻訳 API およびドキュメント翻訳 API を通じて、Microsoft 製品および翻訳顧客に NMT モデルを公開します。これらの API は、プレーンテキストと複雑なファイルをある言語から別の言語に変換します。 Azure Cognitive Services Translator API は、パブリック クラウドと安全な Microsoft Azure Government クラウドで利用できます。さらに、テキスト翻訳 API は Docker コンテナで利用できるため、顧客は企業内でコンテンツを処理して特定の規制要件を満たすことができます。

Azure Cognitive Services Translator には、Custom Translator サービスも含まれています。これにより、ユーザーは独自の翻訳メモリを使用してカスタム機械翻訳モデルを構築し、ビジネスや関連業界で使用されるドメイン固有の用語を翻訳できます。これらのカスタム機械翻訳モデルは、テキストおよびドキュメント翻訳 API を通じて使用できます。

オーディオまたは音声コンテンツを翻訳するために、Azure Cognitive Services Translation は Azure Cognitive Services Speech と緊密に統合されており、Azure Speech SDK を通じて音声翻訳とマルチデバイス会話をサポートします。

Azure Cognitive Services Translator とそれがサポートする製品は、顧客に広く採用されています。このサービスは多くの Microsoft 製品にシームレスに統合されており、誰でも簡単に使用でき、選択した言語でコンテンツを作成できます。 Microsoft 製品の統合には、テキストとファイルの翻訳用の Microsoft 365、Web ページ全体を翻訳するための Microsoft Edge ブラウザー、メッセージの翻訳用の SwiftKey、ユーザーが送信したコンテンツの翻訳用の LinkedIn、外出先での多言語会話用の Translator アプリなどがあります。

<<:  人工知能の時代:知識を活用して人間関係を変える

>>:  人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?

ブログ    
ブログ    

推薦する

深さ優先探索 (DFS) と幅優先探索 (BFS) の 2 つのアルゴリズムの詳細な説明

序文深さ優先探索 (DFS) と幅優先探索は、グラフ理論における非常に重要な 2 つのアルゴリズムで...

Stability AIがAIプログラミングツール「StableCode」をリリース

Stability AI は、プログラミング用の最初の生成 LLM AI 製品である StableC...

AIの急速な発展によってもたらされるエネルギー需要をどう解決するか?

生成 AI テクノロジーは、単純なフレーズを驚くほどリアルな画像に変換し、世界中の人々の想像力をかき...

AIはローカルアプリケーションから大規模な「AI主導」企業へと進化しました

最近、デロイト人工知能研究所は、「企業向け人工知能アプリケーションの現状レポート」と「厳選された A...

人工知能アルゴリズムが核融合の応用に一歩近づく

核融合は現在一般的に使用されている核分裂法よりも安全で環境に優しいことはよく知られています。しかし、...

機械学習に関する12の現実世界の真実

導入現実世界で働くときには、直面しなければならない事実がいくつかあります。この記事ではそれについて説...

3つのステップで声紋システムを構築する方法

背景声紋検索は、その名前が示すように、話者認識であり、音を通じて話者の声を確認または識別します。声紋...

人工知能は投資家に好まれているが、投資家は市場に参入する際には注意する必要がある

人工知能の分野で大きな影響力を持つ企業は、金融市場においても並外れた成長と強さを見せています。 AI...

Google AIがチューリングテストに合格、ビッグモデルドクターが登場か? GPT-4は17人の医師を困惑させた奇妙な病気を診断した

人類に利益をもたらす AGI を開発する必要がある理由の 1 つ:妻は過去 5 年間、あらゆる種類の...

仕事とAIの未来

[[340645]] [51CTO.com クイック翻訳] 人工知能が雇用に与える影響は、現在、さま...

2018年の人工知能の発展に関する5つの予測

2017年は人工知能技術(AI)において画期的な発展があった年でした。過去 1 年間の大きな宣伝にも...

新しい消費者向け IoT と人工知能の開発を加速させる機会は何でしょうか?

近年、世界的な技術開発の加速化が進み、新世代の情報通信技術が次々と導入され、数多くの新たなビジネスモ...

続編が登場します! OpenAIがマスク氏を公式サイトに掲載、複数のメールのやり取りが暴露される

AIの歴史に残るほどのマスク氏とOpenAIのこの訴訟は、ドラマに満ちている! 3月5日、OpenA...

...

工業情報化部など8つの部門:地域人工知能データ処理センターの建設を検討

12月29日、工業情報化部、国家発展改革委員会、教育部、財政部、中国人民銀行、国家税務総局、金融監督...