IT Homeは11月16日、MicrosoftがIgniteカンファレンスでAzure AI Speech用の「Azure AI Speech テキスト読み上げ(TTS)アバター」というAIツールを発表したと報じた。人間のリアルな仮想アバター(デジタルヒューマン)を生成できるとしている。このツールは現在、プレビュー版として一般公開されている。 マイクロソフトは、ユーザーはAzure AI Speechのテキスト読み上げ(TTS)アバターを使用して、「テキストを入力して内容を話す」ことに基づいて仮想アバターを作成し、それを実際の写真トレーニングと組み合わせて、実際の人々に基づいた「インタラクティブなチャットボット」を作成できると述べた。これは、企業のマーケティング、ビジネス、または顧客サービスのシナリオで使用できる。 この Azure AI Speech テキスト読み上げ (TTS) アバターは、主にテキスト アナライザー、TTS サウンド シンセサイザー、TTS 仮想アバター シンセサイザーの 3 つのモジュールで構成されていると報告されています。
マイクロソフトは、従来のバーチャルアバターの制作には時間と労力がかかり、専用の撮影環境の整備が必要で、撮影後の編集作業にもかなりのコストがかかると説明した。現在、マイクロソフトの最新の Azure AI Speech テキスト読み上げ (TTS) アバター サービスを使用することで、初期モデルが確立された後は、ユーザーはテキストを入力するだけで、さまざまな製品紹介やインタラクティブ ビデオなどを作成できます。 Microsoft Azure OpenAI サービスとニューラル ネットワーク TTS 機能を組み合わせることで、より自然なインタラクティブ エクスペリエンスを提供することもできます。 IT Home は、Microsoft が、ユーザーは Azure AI Speech TTS アバターを使用して、企業文化ビデオ、製品紹介、カンファレンスでの CEO のデジタル アバターなど、さまざまなビデオ コンテンツを一括作成できると主張していることを発見しました。また、仮想ライブデジタルヒューマン、チャットロボット、ビジネスロボット、オンライン教育用の AI 教師などを作成することもできます。 Microsoft は、Azure AI Speech のテキスト読み上げ (TTS) アバターが Azure サブスクライバー向けに提供され、さまざまな言語をサポートしていると述べました。ユーザーは、プリセットのアバター オプションから希望のキャラクターを選択したり、独自のアバターをカスタマイズしたりできます。 ユーザーが独自の仮想アバターをカスタマイズしたい場合は、キャラクターのビデオ クリップを一括アップロードする必要があります。Azure プラットフォームはこれらのビデオをオンラインで処理して仮想アバターを生成します。キャラクター本体と音源は分離されており、ユーザーは公式が提供するデフォルトの音源を選択したり、独自のトレーニング音源をアップロードしたりすることができます。 |
>>: ロビン・リー:AIネイティブ時代の「冷たい」思考と「熱い」ドライブ
人工知能 (AI)、機械学習 (ML)、ディープニューラルネットワーク (DNN) は、金融業界のビ...
使用される特徴の数が増えるにつれて、モデルのパフォーマンスが向上することが分かっています。ただし、ピ...
人工知能はこれらすべてを変え、私たちにとって物事をより簡単にしてくれます。 それは、私たちが交流し、...
コペルニクス気候変動サービスによると、2023年は記録上最も暖かい年となっただけでなく、世界の平均表...
[[394391]]自動運転から機械翻訳、不正取引の特定から音声認識、衛星画像認識からビデオストリー...
ザッカーバーグ氏は最近また大きなトラブルに巻き込まれた。リチャード・ブルーメンソール議員(プライバシ...
[[422916]] Python 中国語コミュニティ (ID: python-china) 1....
今日の人工知能分野では、「GPUがあれば十分」というのが徐々にコンセンサスになってきています。十分な...
人工知能はまだ少し遠く、Google の巨大なデータセンターの部屋や神秘的な MIT ロボット工学研...
今日のペースが速く競争の激しいビジネス環境において、サプライ チェーン管理は成功に不可欠な要素です。...
TensorFlow 入門記事: 初心者でも理解できる TensorFlow 入門小学校で受けた理...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
現在の「顔認識システム」は老化防止能力が非常に弱く、人の顔が老化すると認識性能が大幅に低下し、一定期...
UI デザイナーとフロントエンド エンジニアの間にニューラル ネットワークが必要になる場合があります...