AIの威力を改めて見せつける! Baidu Map 20分間のカスタマイズされたパーソナル音声パッケージ

AIの威力を改めて見せつける! Baidu Map 20分間のカスタマイズされたパーソナル音声パッケージ

百度地図は9月19日、「あなたのための『音声』、そして『AI』」記者会見で「音声カスタマイズ機能」を正式に発表した。社内コード名は「百曲玲」。これは地図音声カスタマイズ製品です。ユーザーは百度地図アプリで20文を録音するだけで、約20分で完全な個人用音声パッケージを生成でき、来たる国慶節の旅行に新鮮な体験をもたらします。

「百度地図のエンジニアたちは、社内でこれを『百雀霊』と呼んでいます。百雀とは、美しく心地よいさまざまな鳴き声を持つ自然界のさまざまな鳥の総称です。『百雀霊』とは、何千人ものユーザーが百度地図上で自分の音声パッケージを録音し、自分だけのユニークな声で愛する人への思いやりや友情を表現できることを意味します。」百度地図事業部のゼネラルマネージャー、李穎氏は次のように述べた。「音声カスタマイズ機能は、百度地図を強化したAIのもう一つの傑作です。今回の音声技術と百度地図の統合により、科学技術の力が解き放たれ、技術進歩がもたらす変化と感動を誰もが感じることができることを願っています。」

専用音声パッケージをカスタマイズするプロセスは非常に簡単です。Baidu Map アプリを開き、「Xiaodu Xiaodu」を起動して「私の音声を録音して」と言うか、Baidu Map ホームページで「旅行アシスタント」をクリックして「音声カスタマイズ」に入るだけで、音声カスタマイズの旅を始めることができます。静かな環境で、百度地図の指示に従って、漫画や映画やテレビのセリフなど、録音された興味深いテキストを読み上げ、約20分待つだけで、自分だけの音声パックを手に入れることができ、百度地図の景勝地スマート音声ガイド、スマート音声インタラクション、ナビゲーションなど、あらゆるシーンで使用できます。誰でも自分や家族の音声パックを無料で使用して、景勝地を巡り、放送を聞くことができます。また、録音した個人音声パッケージは、親戚や友人と共有することもできます。子供を恋しく思う親でも、遠く離れた恋人でも、地図音声パッケージを通じて愛する人に近づくことができます。ユーザーの「人気」音声パックは、Baidu Maps によって公式に推奨され、マップの「良い音声」になる機会もあります。

(「シャオドゥシャオドゥ」と叫んで音声パッケージの録音を開始します)

これまで、マップ音声パックの制作には、専門のレコーディングスタジオで大量の言語素材を録音する必要があり、制作には数か月かかっていました。プロセスは複雑で時間がかかるため、マップ音声パックは「有名人限定」となっていました。今、Baidu Mapsの音声カスタマイズ機能により、誰もが「大スター」になれるのです。

音声カスタマイズ機能のリリースに伴い、百度地図の「銀河プロジェクト」が正式に開始されました。第1段階では、華晨宇や秦嵐などの人気アーティストが招待され、個人音声パッケージの録音に参加して百度地図の「スターナビゲーター」となり、すべてのユーザーの旅を新鮮に満たしました。 「ギャラクシープロジェクト」の立ち上げは、有名人の音声パックを録音するための敷居が大幅に下がり、誰もが星のように広大で人々に多くの想像力を与える有名人品質の音声パックを録音できることを意味します。

Baidu Map の音声カスタマイズ機能の背後には、Baidu Brain の音声テクノロジーの強化があります。 AI技術のサポートにより、マップ音声パッケージの制作は月単位から分単位への飛躍的進歩を遂げ、音声パッケージの制作モデルも再定義されました。

百度音声のチーフアーキテクトである賈磊氏は記者会見で、その背後にある技術について次のように明らかにした。「百度地図の音声カスタマイズ機能は、百度の話者韻律転送技術Meitronに基づいています。その特徴は主に、話者音色変換、多感情読み上げ、韻律スタイル転送の3つの側面に反映されており、パーソナライズされた音声合成のカスタマイズの閾値を大幅に下げています。百度の音声技術は、AI時代にさらなる可能性を秘めていると信じています。」

多くの親はかわいい赤ちゃんの音声パックを録音したいと思っていますが、赤ちゃんの発音が不明瞭だったり、間が不規則だったり、中国語が標準的でなかったりすることを心配せずにはいられません。Baidu Mapの音声カスタマイズ機能はこれらの問題を克服し、子供の声の合成を実現しました。同日、百度地図とベビーバスは「幸せな啓蒙と安全な出発」の取り組みを開始し、「千千妙妙」音声パックを発売した。このタイプの漫画音声パックは、運転中に親が赤ちゃんの感情を落ち着かせ、旅行の安全を確保するのに役立ちます。

ユーザーが非常に懸念している音声データのセキュリティ問題について、百度地図は、音声カスタマイズサービスへの百度地図のアクセスは音声パッケージの録音にのみ使用され、他の目的には使用されないと述べた。 Baidu Maps は、ユーザーの許可と同意なしに、ユーザーの音声パッケージを他のユーザーと共有することはありません。

AI 技術の強力なサポートにより、新世代の人工知能マップである Baidu Maps は革新とリードを続けています。今後も百度地図は進化を続け、より安全でスマート、そして効率的な旅行サービスをユーザーに提供していきます。この建国記念日の休日には、独自のボイスパックと AI マップをご持参ください。

<<:  北京、上海、深セン、杭州、中国の人工知能産業のリーダーは誰でしょうか?

>>:  ロボットが人間に取って代わるのは時間の問題です。まずこれらの仕事がなくなるでしょう。

ブログ    

推薦する

WuDao 2.Oがリリースされ、中国語を中核とする大規模な事前学習済みモデルプラットフォームエコシステムを構築

【51CTO.comオリジナル記事】​​​ GPT-3は昨年5月にリリースされました。 OpenAI...

Java 仮想マシンの詳細な説明 ---- GC アルゴリズムとタイプ

この記事の主な内容: GCの概念GCアルゴリズム参照カウント方式(循環参照の問題を解決できず、Jav...

年次レビュー:2020 年の 5 つの注目すべきテクノロジー トレンド、時代のトレンドに遅れずについていく

世界の歴史は発明の歴史でもあります。火薬の発明は世界地図を変え、電灯の発明は夜を変え、車の発明は空間...

上海で一人っ子を亡くした母親が、AIを使って14歳の娘を「蘇らせた」...

大切な人が亡くなったら、その人の記憶をAIに引き渡しますか?「The Debaters」のこの討論テ...

衝撃の2017年!この10日間は中国の人工知能の時代

2017年にはすでに「残高不足」が発生。今年、中国の人工知能開発は多くの進歩を遂げ、実りある成果を達...

転移学習に使用される 4 つのコンピュータ ビジョン フィールド モデル

導入SOTA 事前トレーニング済みモデルを使用して、転移学習を通じて現実世界のコンピューター ビジョ...

MetaのAIは、メタバースで「あなたの言葉を実現」することを可能にします

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

マイクロソフトの面接アルゴリズムに関する 4 つの質問

(1)要素が0から65535までの任意の数値であり、同じ値が繰り返し出現しない整数列。 0 は例外で...

産業用ロボットの開発動向

産業用ロボットは、さまざまな産業用タスクを自動的に実行できる一種の機器として、製造、組み立て、梱包、...

ファーウェイのロボット犬が公開:AI技術を使用して動的なマルチターゲット追跡と追従を実現

ロボット界のインターネット有名人といえば、ボストン・ロボット・ドッグを挙げなければなりません。そして...

2020年のAI目視検査の応用価値

【51CTO.com クイック翻訳】過去 10 年間、製造業者は継続的に利益を向上させるために自動化...

信頼できる AI はどのように発展すべきでしょうか?

現在、人工知能の応用範囲と深さは絶えず拡大しており、情報インフラの重要な部分になりつつあります。しか...

コンピュータービジョンにおける AI の役割は何ですか?

コンピュータービジョン技術を使用することで、コンピューターは視覚的に物を識別したり確認したりすること...

マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは 7 月 11 日にプレスリリースを発行し、Combinable Diffusion...