Microsoft Azure AI テキスト読み上げサービスのアップグレード: 新しい男性の声とより多くの言語サポート

Microsoft Azure AI テキスト読み上げサービスのアップグレード: 新しい男性の声とより多くの言語サポート

8月9日、Microsoft Azureは企業向けにクラウドベースのサービスと機能を多数提供開始しました。その1つが、機械学習と人工知能を使用してテキスト入力をリアルな音声に変換するAzure AI Text-to-Speechです。

2021年、マイクロソフトは、複数の異なる言語で自然に話すことができる女性の音声であるJenny Multilingualをリリースしました。本日、Microsoft は Azure AI テキスト読み上げ機能のアップグレードを発表しました。より多くの言語サポートが追加されただけでなく、男性の声である Ryan Multilingual も追加されました。

Microsoft はブログ投稿で次のように述べています。「この追加により、ユーザーに選択肢が増えるだけでなく、包括的で多様なユーザー エクスペリエンスを作成することもできます。」 Azure Text-to-Speech では、男性の声を導入することで、テクノロジがさまざまなシナリオやユーザーの好みに適応できるようになり、開発者はより幅広いエンド ユーザーの共感を呼ぶソリューションを設計できるようになります。さらに、両方の新しい音声には自動言語予測機能が搭載されており、入力テキストに基づいて入力言語を自動的に識別し、それに応じて音声出力を調整するため、手動でタグ付けする必要がなくなります。また、

このアップデートにより、サポートされる言語が次のように 14 から 41 に拡張されます。

  • ar-EG
  • ar-SA
  • ca-ES
  • cs-CZ
  • だDK
  • デAT
  • 脱CH
  • de-DE
  • ja-JP ja-JP
  • ja-CA 日本語
  • ja-JP 日本語
  • ja-HK
  • ja-IE
  • ja-IN 翻訳
  • ja-JP 日本語
  • es-ES
  • es-MX
  • fi-FI
  • fr-BE
  • fr-CA
  • フランス語-CH
  • フランス語-フランス語
  • ハイイン
  • フーフー
  • id-ID
  • it-IT
  • 日本語
  • 韓国語
  • いいえ
  • オランダ語-BE
  • オランダ語
  • pl-PL
  • ポルトガル語-BR
  • pt-PT
  • ru-RU
  • sv-SE
  • th-TH
  • tr-TR
  • 中国
  • 中国語-香港
  • 日本語

さらに、IT Homeは、マイクロソフトが、入力された特定の言語に最もよく一致するようにAI音声の発音、イントネーション、音韻を自動的に変更できる新しいシステムを開発したと述べたことも指摘した。マイクロソフトは次のように述べています。「この画期的な機能により、ユーザーはテキスト入力時に異なる言語を簡単に切り替えることができ、より没入感とリアルな多言語体験を実現できます。」

新しい男性の声、言語サポート、適応型システムは現在、Azure の米国東部、ヨーロッパ西部、東南アジアの各リージョンでパブリック プレビュー中です。

<<:  老黄が深夜に爆発、AIGCがiPhoneの瞬間に突入!ハギングフェイスは最強のスーパーコンピューターに接続されており、謎のグラフィックカードはA100よりも優れている

>>: 

ブログ    
ブログ    
ブログ    

推薦する

第2世代GANネットワークの台頭? DALL·E Miniのグラフィックが恐ろしく、外国人も大興奮!

現在、GoogleやOpenAIなどの大手企業が開発したテキストから画像へのモデルは、興味深いニュー...

...

わずか数行のコードで最初のウェブアプリを作成

データ サイエンス プロジェクトの展開は、データ サイエンティストと機械学習エンジニアの両方に必要な...

Waymo - 自動運転技術の解説

[[437828]]今日は、Google の自動運転車 Waymo がどのようにそれを実現するかを見...

中国の教授が犯罪認識率97%の人工知能「検察官」を開発、現在テスト中

[[442697]]最近、「中国の教授らが人工知能検察官を開発中」というニュースが多くの海外ネットユ...

ジェネレーティブ AI がデータ センターの要件をどのように変えるか

データ センターとは何ですか。どのように使用しますか。具体的には、データ センターにはどのような種類...

言語間、人間の声と犬の鳴き声の相互変換をサポートし、最も近いものだけを使用するシンプルな音声変換モデルはどれほど素晴らしいか

AIが関わる音声の世界はまさに魔法のようです。ある人の声を別の人の声に置き換えるだけでなく、動物と声...

...

量子コンピューティングとブロックチェーンの未来

量子コンピューティングはブロックチェーンを破壊するのか、それともより安全にするのか? 01 序文コン...

分散システム設計のための負荷分散アルゴリズム

概要分散システムの設計では、通常、サービスはクラスターに展開されます。クラスター内の複数のノードが同...

誇大広告か、効率か?サイバーセキュリティにおける人工知能の実用的応用

サイバーセキュリティにおける人工知能をめぐる誇大宣伝は、多くの専門家の間で不満を引き起こしています。...

ロボティック プロセス オートメーションの導入を成功させるための 8 つのヒント

RPA は、企業が導入できる、リスクが低く価値の高い自動化アプローチの 1 つです。 RPA ツール...

リスク管理シナリオの全プロセスモデルの構築と適用

オンライン マイクロクレジットの一般的なリスク管理シナリオは、融資前、融資中、融資後の段階に分けられ...

FacebookはAI音声アシスタントを開発しているが、財務上の将来は不透明

Facebook は近年、世論の嵐に何度も巻き込まれてきたが、技術革新に関しては決して無縁ではなかっ...

機械学習におけるモデル展開とは何ですか?

機械学習におけるモデルのデプロイメントとは、機械学習モデルを既存の運用環境に統合し、入力を受け入れて...