マイクロソフトのカスタムニューラル音声技術により、ユーザーは極めてリアルで人間のような音声を作成できるようになりました。

マイクロソフトのカスタムニューラル音声技術により、ユーザーは極めてリアルで人間のような音声を作成できるようになりました。

マイクロソフトが3月4日に公式発表したところによると、Azure Cognitive Servicesの音声サービスの一部であるCustom Neural Voiceのテキスト読み上げ機能がこのほど一般提供開始されたという。この機能により、ユーザーは Microsoft の画期的なニューラル テキスト読み上げモデルを使用して、アプリ用に非常にリアルで人間のようなカスタム音声を作成できるようになります。作成された音声は非常にリアルであるため、Microsoft はユーザーが責任を持ってテクノロジを使用できるようにアクセスを制限しています。

[[385187]]

マイクロソフトは、

  • 「マイクロソフトは責任ある AI への取り組みの一環として、個人と社会の権利を保護し、人間とコンピューターの透明なインタラクションを促進し、有害なディープフェイクや誤解を招くコンテンツの拡散に対抗することを目的として、カスタム ニューラル ボイスを設計、リリースしました。この目的のため、カスタム ニューラル ボイスへのアクセスと使用を制限しています。」

カスタム音声を作成するには、音声を録音し、それをトレーニング データとしてアップロードするだけです。 Azure Speech Services は、録音に合わせて独自の音声チューニングを作成します。カスタム ニューラル音声はリアルで自然な音声で、ブランドを表現し、ユーザーが自然な会話形式でアプリと関わることを可能にします。

Microsoft は、以下の顧客がすでにこの最新の TTS 機能を使用していることを強調しています。

  • AT&T / ワーナー ブラザース: 同社は最近、テキサス州ダラスの AT&T エクスペリエンス ストアで、顧客がバッグス バニーと直接会話できる、これまでにない創造的でインタラクティブな体験を開始しました。
  • Progressive: プログレッシブ保険の代表的なスポークスパーソンである Flo の声を使用して、Flo チャットボットが作成され、顧客の問い合わせプロセスを合理化し、パーソナライズされたエクスペリエンスを提供します。
  • Duolingo: 新しい言語の学習が達成可能かつ応用可能であると感じられるよう、Duolingo ではレッスンを使用して多様で様式化された音声を作成します。

<<:  将来、ロボットは手術を支援し、反復作業をより効率的に実行できるようになるかもしれない。

>>:  2つのセッションにおけるインターネット大手の提案の要約:デジタル経済とスマートカーが頻出語に

ブログ    

推薦する

人工知能が普及せず、自動運転に支障?

今回の世界経済サイクルが底を打つにつれ、過去2年間の多くのホットスポットが「衰退」し、「閉鎖」し始め...

Microsoft、SAP、Oracle などの世界的なソフトウェア大手は、生成 AI をどのように取り入れているのでしょうか?

2023年は、生成AIテクノロジーが大きな進歩を遂げる年です。ChatGPTなどのAIツールはテク...

Haiyun Jiexun の Ren Zhongping 氏: アイデアから実現まで、AI はわずか 10 クリックで実現します。

[51CTO.comよりオリジナル記事] 10月13日、中関村スタートアップストリートで、中関村ス...

グーグルは、人工知能の進歩により飛行機による地球温暖化への影響を大幅に軽減できると主張

グーグルは8月14日、飛行機による気候への影響を大幅に軽減できる人工知能の分野で大きな進歩を遂げたと...

新しいインフラの推進により、人工知能の応用は新たな段階に入る

レポート概要新しいインフラストラクチャにより人工知能アプリケーションの実装が加速COVID-19パン...

ディープラーニングでは音声認識の問題を解決できない

[[212222]]音声認識にディープラーニングが導入されて以来、単語の誤り率は急速に低下しました。...

スマートなモノのインターネットを導入する時が来た

[[427797]]画像ソース: https://pixabay.com/images/id-567...

新しい機械学習システムがロボットに社会的なスキルを与える

ロボットは大学のキャンパスに食べ物を配達したり、ゴルフコースでホールインワンを達成したりすることがで...

AI時代に向けてキャリアを再設計する時が来た

Pew Researchの分析によると、AI、特にAIGCの台頭は管理職や専門職に大きな影響を与える...

OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

IT Homeは1月10日、ChatGPTの開発元であるOpenAIが最近、ChatGPTのようなA...

BOE の革新的なテクノロジーは、国際的な氷上および雪上イベントを強化し、世界クラスのスポーツイベントをより華やかにします。

春の始まりの2月4日、世界の注目は北京に集まった。音楽、光、影が流れる中、オリーブの枝に囲まれた巨大...

人工知能とモノのインターネットを組み合わせた5つの技術応用トレンド

今年末までに、世界中で接続されるデバイスの数は 500 億台に達すると予測されており、モノのインター...

スマートセンサー: 従業員をオフィスに戻すための鍵となるか?

新型コロナウイルス感染症のパンデミックにより、多くの人々の働き方が変化しました。現在、多くの企業は、...

Tongyi Qianwenが再びオープンソース化、Qwen1.5は6つのボリュームモデルを導入、そのパフォーマンスはGPT3.5を上回る

春節の直前に、同義千文モデル(Qwen)バージョン1.5がリリースされました。今朝、新バージョンのニ...

顔認識:最高裁は規則に従うよう求めている

近年、顔認識技術は急速に発展し、入場時の顔スキャンや支払い時の顔スキャンに広く使用され、私たちの日常...