AI はあらゆる人間の声を再現できます。これはポッドキャストにとって何を意味するのでしょうか?

AI はあらゆる人間の声を再現できます。これはポッドキャストにとって何を意味するのでしょうか?

ポッドキャスティングは、よりカジュアルな形式のオーディオストーリーテリングへと進化しています。複雑な言語は存在せず、ホストとリスナーの関係性に重点が置かれています。ホストは、すべてを理解しやすく、反応しやすくするために言語を使用しようとします。オーディオストーリーの人気は高まっており、データもそれを裏付けています。 Statistaによると、2018年には米国にすでに7,500万人のポッドキャストリスナーがおり、2024年までに月間リスナー数は1億6,400万人に達すると予想されています。 2019年から2023年までのCAGRは17%と推定されています。

[[345947]]

2020年には、アメリカ人の4分の3がポッドキャストを認識しており、半数以上(55%)がすでにポッドキャストを聴いていると主張しています。世界で最も収益の高いポッドキャストは、ジョー・ローガンの「The Joe Rogan Experience」で、2019年に5,000万ドルを稼ぎ、毎月2億回近くダウンロードされています。 現在ポッドキャスト業界が直面している主な問題は、編集の独立性を維持しながら、このような急速な成長を支えるために必要なリソースをどのように集めるかであり、音声複製機能を備えた人工知能などの画期的な技術が、少なくとも部分的な解決策を提供できる可能性があります。 ニクソン プロジェクトは、AI が人間の声を元の声と区別がつかないほどに再現できるという説得力のある例です。

MITの研究者、ジャーナリスト、アーティストのチームが、音声クローン会社RespeecherおよびVDR会社Canny AIと共同で、宇宙飛行士のニール・アームストロングとエドウィン・「バズ」・オルドリンがミッションを完了できずに月面に取り残された最初の月面探検のもう一つの歴史を作成した。 彼らはニクソン大統領の実際のビデオを改変して偽物を作成し、月面着陸は悲劇的な結末を迎えたと彼が世界に語るのを聞かせた。

ポッドキャストにおける人工知能の活用方法

コンピューター音声の主な課題は、ロボットのような音声を避けながら、人間の声や感情のニュアンスを再現することです。人工知能技術を活用した音声変換技術は、この目標を正確に達成する手段を提供します。

[[345948]]

Apple の Siri、Amazon の Alexa、Microsoft の Cortana、Google Assistant などの仮想アシスタントは、依然としてテキスト読み上げ機能を使用しています。 TTS は今でも非常に便利なテクノロジーですが、音声を異なる音にするのは非常に複雑です。 たとえば、Siri を年配の男性のように話すには、事前に録音されたファイルに加えて、会話のすべての単語を含む新しいオーディオ ファイルが必要になります。音声から音声への変換がもたらすメリットをいくつか見てみましょう。 AI を使用してポッドキャスターの音声クローンを作成するにはどうすればよいでしょうか? AI によって音声クローンが可能になります。あらゆるポッドキャスト プロジェクトのあらゆるサウンドを完璧に再現するのに役立ちます。 「スマートカクテル」は通常、古典的なデジタル信号処理アルゴリズムと独自のディープ生成モデリング技術の 2 つの要素で構成されており、コンテンツ制作者は最も適切なサウンドを使用できます。

有名人をプロジェクトに招待する

俳優、作家、アスリートなどが有名になればなるほど、彼らをポッドキャストに出演させることは難しくなります。しかし、人工知能を使って人間の声を再現すれば、非常に忙しい人間がスタジオに到着するのを待つ必要はありません。聴衆をレコーディングスタジオに連れて行くために多くの時間と費用をかけなくても、聴衆にお気に入りのサウンドの録音を提供することができます。

昔の音を取り戻す

たとえ俳優が亡くなっていたとしても、音声クローンはプロジェクトを希望通りに完成させるのに大いに役立ちます。亡くなる前のケネディ大統領に関する歴史的なポッドキャストを制作していますか? 音声変換テクノロジーを使用すると、近似声ではなく、大統領の正確な声を使用できます。

子どもの声を活用する

子どもたちは、必ずしも内容が面白いのではなく、単に言い方(口調、イントネーション、アクセントなど)が面白いという理由で、よくとても面白いことを言います。同時に、彼らと一緒に働くことは困難です。音声合成では、プロの俳優が子供とまったく同じように言葉を話すことで、このプロセスを簡素化できます。

[[345949]]

画像ソース: unsplash

· ポッドキャストプロジェクトが完了するまでスピードアップ

人工知能は人間の声を一瞬で再現することができます。必要なのは、対象となるサウンドの高品質な録音を提供することだけであり、それほど時間はかかりません。 2017年、ポッドキャストの広告収入は2億2000万ドルに達し、毎年倍増しています。潜在的な広告主を引き付ける主な要因は、ユーザーエンゲージメントの向上と、ポッドキャスト広告が約 90% の完了率で視聴可能であるという事実です。 さらに、広告主は特定のポッドキャスト スロットに対して最大 30 ドルの CPM (インプレッション 1,000 回あたりのコスト) を支払う用意があります。 Facebook の平均 CPM が 6 ドルであることを考慮すると、この数字はより納得がいきます。 ケーブルテレビは徐々にネットワークテレビに取って代わっており、ポッドキャストとラジオには多くの類似点があります。この類推をラジオ広告予算に限定したとしても、ポッドキャスト業界の現在の財政状況にさらに 200 億ドルの利益がもたらされることになります。冒頭で述べたように、リスナー数の増加は、利益の継続的な体系的な成長への期待を正当化します。

[[345950]]

画像ソース: unsplash

このような数字は、ポッドキャスティングが今後も定着し、オーディオ コンテンツの作成者を支援するより効果的な方法が切実に必要であることを明確に示しています。上に挙げた点は、AI が実現できることのほんの一部にすぎません。AI による音声クローン ポッドキャストは、業界全体を発展させ、編集の独立性の問題をより適切に処理することができます。

この記事はWeChatの公開アカウント「Reading the Core」から転載したもので、以下のQRコードからフォローできます。この記事を転載する場合は、Duxinshu の公開アカウントにご連絡ください。

<<:  5Gのサポートにより、AIの顔を変えること以外に人工知能は何ができるのでしょうか?

>>:  マイクロソフトとパートナーは、AIへのアクセスを制限するデータ砂漠の縮小に取り組んでいる。

ブログ    
ブログ    

推薦する

TensorFlow Lattice: 柔軟で制御可能、説明可能な機械学習

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Hinton チームの新しい CV 研究: ターゲット検出に言語モデルを使用、DETR に匹敵するパフォーマンス

[[426028]]視覚オブジェクト検出システムは、画像内のすべての定義済みカテゴリのオブジェクト...

AI + データサイエンス: スポーツ業界を変える6つの方法

[[329380]]テクノロジーの発展に伴い、人工知能とデータサイエンスはスポーツの分野でますます重...

人工ニューラル ネットワーク入門 - コンピューターは学習できるか?

人工ニューラル ネットワークは、人工知能 (人間の認知能力を模倣するプログラム) を作成する方法です...

Amazon クラウド テクノロジーにより、Yidiantianxia は AIGC の波の中で新しいマーケティング パラダイムを構築できるようになりました。

生成的 人工知能 それがもたらす熱狂は継続し、すべての人の思考を刺激し続けます。今日の「百モデル戦争...

データ管理はAI革命の最大の課題となるでしょうか?

最新のデータへの投資は人工知能の拡張を成功させる上で重要ですが、調査によると、企業の半数がコストの障...

家庭用ロボットを作り、独自の研究開発の道を歩む

ロボットを作ることは私の子供の頃からの夢でした。 2011年に私はハルビン工業大学に入学し、そこが私...

製造業に人工知能を適用するにはどうすればよいでしょうか?

現在、製造企業で使用されている人工知能技術は、主にインテリジェント音声対話製品、顔認識、画像認識、画...

マイクロソフトがAR仮想「翻訳機」をデモ、将来の翻訳業界に影響を与える

7月22日のニュース:AR技術は継続的な発展により、徐々に成熟してきました。他の新しいテクノロジーと...

ガートナー: CIO がビッグモデルを選択するための 6 つの基準と 5 つの主な導入方法

過去 2 年間で、ChatGPT は急速に広まりました。過去 6 か月間で、多くの企業が生成 AI ...

GitHubが機械学習ベースのコードスキャンと分析機能を開始

GitHub は、クロスサイト スクリプティング (XSS)、パス インジェクション、NoSQL イ...

2021 年の世界トップ 10 の人工知能アプリケーション

人工知能は、過去 10 年間にわたって年間を通じて最もホットな話題の 1 つとなっています。そして、...

マッキンゼーのパートナー、カレル・エルート氏:「3×Simpler」は産業用ロボットのユーザーエクスペリエンスを向上させます

2年前、イタリアのテノール歌手アンドレア・ボチェッリがイタリアのピサにあるヴェルディ劇場でルッカ・フ...

顔スキャン決済は問題多し、アマゾンは「手のひら」スキャンを選択し無人スーパーで正式に商品化

さあ、手払いについて学んでみましょう〜アマゾンはこのほど、自社が開発した手のひら認識技術「Amazo...