マイクロソフトのカスタムニューラル音声技術により、ユーザーは極めてリアルで人間のような音声を作成できるようになりました。

マイクロソフトのカスタムニューラル音声技術により、ユーザーは極めてリアルで人間のような音声を作成できるようになりました。

マイクロソフトが3月4日に公式発表したところによると、Azure Cognitive Servicesの音声サービスの一部であるCustom Neural Voiceのテキスト読み上げ機能がこのほど一般提供開始されたという。この機能により、ユーザーは Microsoft の画期的なニューラル テキスト読み上げモデルを使用して、アプリ用に非常にリアルで人間のようなカスタム音声を作成できるようになります。作成された音声は非常にリアルであるため、Microsoft はユーザーが責任を持ってテクノロジを使用できるようにアクセスを制限しています。

[[385187]]

マイクロソフトは、

  • 「マイクロソフトは責任ある AI への取り組みの一環として、個人と社会の権利を保護し、人間とコンピューターの透明なインタラクションを促進し、有害なディープフェイクや誤解を招くコンテンツの拡散に対抗することを目的として、カスタム ニューラル ボイスを設計、リリースしました。この目的のため、カスタム ニューラル ボイスへのアクセスと使用を制限しています。」

カスタム音声を作成するには、音声を録音し、それをトレーニング データとしてアップロードするだけです。 Azure Speech Services は、録音に合わせて独自の音声チューニングを作成します。カスタム ニューラル音声はリアルで自然な音声で、ブランドを表現し、ユーザーが自然な会話形式でアプリと関わることを可能にします。

Microsoft は、以下の顧客がすでにこの最新の TTS 機能を使用していることを強調しています。

  • AT&T / ワーナー ブラザース: 同社は最近、テキサス州ダラスの AT&T エクスペリエンス ストアで、顧客がバッグス バニーと直接会話できる、これまでにない創造的でインタラクティブな体験を開始しました。
  • Progressive: プログレッシブ保険の代表的なスポークスパーソンである Flo の声を使用して、Flo チャットボットが作成され、顧客の問い合わせプロセスを合理化し、パーソナライズされたエクスペリエンスを提供します。
  • Duolingo: 新しい言語の学習が達成可能かつ応用可能であると感じられるよう、Duolingo ではレッスンを使用して多様で様式化された音声を作成します。

<<:  将来、ロボットは手術を支援し、反復作業をより効率的に実行できるようになるかもしれない。

>>:  2つのセッションにおけるインターネット大手の提案の要約:デジタル経済とスマートカーが頻出語に

ブログ    
ブログ    

推薦する

顔認識技術の開発と実用的なソリューションの設計

顔認識技術は、Google、Facebook、Alibaba、Tencent、Baiduなどの国内外...

AIが中古高級品の真贋を判別、同社は精度は99.1%と主張

12月26日、高級品鑑定機関Entrupyは人工知能技術を使用して、さまざまなブランドのハンドバッグ...

2020年が過ぎようとしていますが、これらの新しいテクノロジーがもたらした問題は依然として残っています。

2020年、疫病による経済的、社会的不確実性にもかかわらず、人工知能技術は加速的に発展し続けました...

推薦システムに関する6つの衝撃的な「秘密」

1990年代にレコメンドシステムが誕生して以来、2024年時点で32年の開発の歴史があります。過去...

...

TCPとUDPの違いと、フロー制御、輻輳制御、高速再送、高速回復アルゴリズムの詳細な説明

[[413351]] UDPとTCPの違い前回の記事では、TCP の接続を確立するための 3 ウェイ...

HRがAIバイアスを理解し軽減する方法

人工知能 (AI) と機械学習 (ML) がもたらすメリットは広く認識されています。このテクノロジー...

...

人工知能は科学研究に革命を起こす力を持っている

人工知能 (AI) は、コンピューター サイエンス、数学、心理学、言語学などの分野が関わる学際的な分...

予想外だが妥当: ガートナーの 2020 年データ サイエンスおよび機械学習プラットフォームのマジック クアドラントの解釈

最近、ガートナーはデータ サイエンスおよび機械学習 (DSML) プラットフォームに関するマジック ...

AIがセキュリティの自動化、分析、対応にどのように役立つか

人工知能 (AI) は、チャットボットから自動運転車まで、あらゆるものを説明するために使用できる幅広...

...