IT Homeは4月12日、マイクロソフトが最近、最新の音声技術を発表したと報じた。この技術は「感情レベル」の簡単な調整をサポートし、インテリジェント音声の感情表現をより繊細かつ制御可能にする。
人間の感情は、声や口調の微妙な変化に大きく反映されます。たとえば、「さようなら」という言葉は、時には穏やかで控えめだったり、時には幸せでリラックスしていたり、時には決然として怒っていたりします。 Microsoft Intelligent Voice は、1 パーセントを定量単位、落ち着いた口調をゼロ点として使用して、明るい、悲しい、怒っている、怖い、不機嫌、真剣、愛情、優しさ、落ち込んでいる、恥ずかしい、穏やかなどの感情を定量化できます。これにより、仮想キャラクターは数千の感情を瞬時に持つことができ、コンテンツ作成がより現実的になります。 IT Homeは、小小、雲熙、雲葉、小漢、小軒、小墨、小瑞などマイクロソフトの人工知能中国語音声がすべて「感情レベル」調整技術をサポートしていることを知りました。彼らはそれぞれ年齢、性別、性格が異なります。 インテリジェント音声の感情レベル調整可能なデモビデオ: Microsoft Intelligent Speech Emotion Adjustment は適応型ニューラル ネットワークに基づいており、開発者は SSML タグ (音声合成マークアップ言語) を使用して感情の度合いを簡単に制御できます。同時に、プログラミングや SSML タグの経験がない一般ユーザーも、オーディオ コンテンツ作成プラットフォームを通じてこの機能を使用できます。
開発者向け: Microsoft インテリジェント音声感情調整テクノロジ感情調整例 1 一般向け:マイクロソフトのインテリジェント音声感情調整技術感情調整例2 さらに、自動テキスト感情分析技術と組み合わせることで、マイクロソフトのインテリジェント音声技術は感情のカテゴリーを自動的に予測し、感情の変化に満ちた作品をインテリジェントに解釈することができます。 Microsoft のインテリジェント音声感情調整テクノロジーにより、オーディオ制作はまるで監督のキャスティングのようになっており、最も適した音声と最も適切な感情を使用して、より良い作品を実現します。チャット ロボット、オーディオ ブックの読み上げ、映画やテレビの自動吹き替え、ゲームなどのシナリオに適しています。 AI オーディオ コンテンツ作成ツール: https://speech.microsoft.com/audiocontentcreation |
>>: AIがワンクリックでタトゥーを除去し、数秒でスターの「素顔」を見ることができる
企業で人工知能が応用され、開発されるにつれて、ビジネスリーダーは市場競争力を向上させるためにクラウド...
[51CTO.com クイック翻訳]ニューラルネットワークは人工知能の分野で非常に人気が高まっていま...
[[442909]] [51CTO.com クイック翻訳]テスラは2019年4月に「Autonomy...
「万能トランスフォーマー」として知られるマンバは、発売から2か月も経たないうちに高性能ビジュアルバー...
11月19日、アリババ、百度、ファーウェイ、テンセント、網易など国内有名企業が企画・主催する201...
9月27日、ネイチャー誌は45の機関からなる国際科学研究チームの最新の研究成果を発表した。 200...
1. 問題と課題1. 問題の背景2018年以来、Kuaishouの事業全体は急速に発展しており、チー...
人工知能はあらゆる分野に革命をもたらしており、銀行業も例外ではありません。 調査によると、世界の人工...
データにラベルを付け、正確な機械学習モデルを開発することはデータ サイエンティストにとって困難であり...
顔認識技術は国民の自由に深刻な脅威を与えるほど強力になっている。それにもかかわらず、業界は繁栄し続け...
私たちは、生成型 AI の出現によって推進される技術革命の真っ只中にいます。 これは単なる技術の漸進...
このチュートリアルでは、OpenAI の Whisper と GPT-4 モデルを使用して自動会議議...