東京オリンピックが閉幕しました。中国選手団は金メダル38個、銀メダル32個、銅メダル18個を獲得し、海外オリンピックでの最高記録に並びました。オリンピック期間中、Baidu Brain の先進的な音声技術をベースにした Baidu Smart Cloud は、CCTV Sports Client を支援して、ユーザーにリアルな音声放送を提供し、オリンピックに新たな体験をもたらしました。 CCTV Sports Client はオリンピック競技ニュースの重要なプラットフォームとして、メダル情報を画像とテキストで表示するだけでなく、今回のオリンピック期間中に新たに追加されたインテリジェント音声放送モードもユーザーから好評を得ています。これは百度スマートクラウドの技術サポートと切り離せないものです。CCTVスポーツクライアントは百度スマートクラウドと提携し、高度に擬人化され、滑らかで自然な音声合成サービスを統合し、オリンピック競技のインテリジェント音声放送の新しいモードを生み出しました。優勝後は、インテリジェントなオーディオとテキストを推進し、タイムリーなオリンピック競技情報をユーザーに提供し、オリンピックの独特の魅力を感じさせます。 Baidu のインテリジェント クラウド音声合成サービスを使用すると、どこにいても最新のイベント アップデートを迅速かつ正確に取得でき、チャンピオンシップの瞬間を見逃すことはありません。 音声合成サービスが現実の放送体験をもたらす オリンピック競技の情報伝達はタイムリーかつインテリジェントでなければなりません。ユーザーに高品質で多様なオリンピック体験を提供するためには、AI技術を有効活用することが重要です。 CCTV Sportsクライアントは、Baidu Brainが独自に開発した並列WaveRNN合成技術を採用したBaidu Intelligent Cloud音声合成サービスを統合しています。合成音声は高度に人間化されており、感情表現やリズム表現が大幅に向上しています。優勝が決まると、タイムリーに発表され、ユーザーは実際の放送のような体験を楽しむことができます。 主な技術的利点:非常に人間的で、滑らかで自然 WaveRNN 合成技術では、発音セグメントを基本合成単位として使用します。複数の発音セグメントが並列に合成され、各セグメントは自己回帰方式で順次合成されます。同時に、発音セグメント間の WaveRNN 隠し状態の連続性を確保するために、隠し状態予測ネットワークを使用して各発音セグメントの初期隠し状態を提供し、並列合成によって発生する WaveRNN 隠し状態の中断問題を効果的に解決し、並列合成の高品質を保証します。 一方、CPU と GPU の異種コンピューティングの使用、最適化された合成効率、ソフトウェアとハードウェアの協調的な加速により、元の WaveRNN のリアルタイム レートが低いという業界の問題を克服しました。この発音フラグメントに基づく隠れた連続 WaveRNN 並列リアルタイム音声合成技術は、従来のパラメータおよびスプライシング システムからニューラル TTS システムへの音声合成技術の変革を大きく促進し、Baidu が業界で初めて RNN ニューラル ボコーダーに基づく大規模な産業展開を完了することを可能にしました。 また、魅力的な男性の声、甘い女性の声、かわいい子供の声など、さまざまなスタイルの音声ライブラリを提供しており、中国語や中国語と英語の混合読み上げも問題ありません。同時に、顧客が高品質の合成音声をカスタマイズできるように、Baidu Smart Cloud は、実際の人の発音効果に近く、高い復元性、高い明瞭性、高い安定性などの利点を備えたカスタマイズされた音声ソリューションもサポートしています。Baidu Smart Cloud は、顧客のビジネスニーズに迅速に対応し、顧客向けの音声をカスタマイズできます。 マルチシナリオアプリケーション、高品質な体験がすぐそばに オリンピック競技の放送以外にも、Baidu Intelligent Cloud 音声合成技術には多くの応用シナリオがあり、あなたのすぐそばにあります。
今後、百度スマートクラウドは、スポーツイベントの数を増やし、エキサイティングな競争ゲームを提供するために、AIテクノロジーの利点を十分に発揮し、インテリジェントで革新的なサービスを継続的に生み出し、さまざまなシーンで顧客のニーズを満たし、ユーザーがまるでスタジアムにいるかのような感覚を味わえるようにし、AIテクノロジーがもたらす新しいスポーツイベント体験を真に体験できるようにします。 |
<<: ハイパーオートメーションの旅を始めましょう: 仕事のやり方を変え、運用プロセスを簡素化しましょう
>>: 自動化とロボット工学:どちらがあなたの会社に適していますか?
ニューヨーク・タイムズ紙によると、世界の AI サイバーセキュリティの求人市場では、2021 年まで...
個人ユーザー向けの Microsoft Copilot メンバーシップ バージョンはここにあります。...
Zhongcheng が翻訳した記事にはタグが付けられています。ユーザーはタグに基づいて興味のある記...
テスラは6月22日、@Tesla AIというTwitterアカウントを作成し、「テスラは自律型ロボッ...
[[428042]]今後予測できることは、人工知能の時代が徐々に深まり、私たちの生活がSF映画のリ...
第三者の介入なしに何十億ものデバイスを接続してデータを交換できるため、モノのインターネット (IoT...
毎年恒例の11.11グローバルショッピングフェスティバルが近づいており、JD.comは再び歴史を刻み...
オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(AN...
統計学の入門コースを受講したことがあるなら、データ ポイントは理論を刺激したりテストしたりするために...
[[431746]]自動車業界は、新しい技術の最前線に立つことが多いです。業界では数十年にわたって組...
パンデミックの間、リモートワークは必須となり、多くのビデオ会議ツールが普及しました。 Zoom は最...
[[204469]]概要ガベージコレクションは、通常「GC」と呼ばれます。1960年にMITのLis...