ポッドキャスティングは、よりカジュアルな形式のオーディオストーリーテリングへと進化しています。複雑な言語は存在せず、ホストとリスナーの関係性に重点が置かれています。ホストは、すべてを理解しやすく、反応しやすくするために言語を使用しようとします。オーディオストーリーの人気は高まっており、データもそれを裏付けています。 Statistaによると、2018年には米国にすでに7,500万人のポッドキャストリスナーがおり、2024年までに月間リスナー数は1億6,400万人に達すると予想されています。 2019年から2023年までのCAGRは17%と推定されています。
2020年には、アメリカ人の4分の3がポッドキャストを認識しており、半数以上(55%)がすでにポッドキャストを聴いていると主張しています。世界で最も収益の高いポッドキャストは、ジョー・ローガンの「The Joe Rogan Experience」で、2019年に5,000万ドルを稼ぎ、毎月2億回近くダウンロードされています。 現在ポッドキャスト業界が直面している主な問題は、編集の独立性を維持しながら、このような急速な成長を支えるために必要なリソースをどのように集めるかであり、音声複製機能を備えた人工知能などの画期的な技術が、少なくとも部分的な解決策を提供できる可能性があります。 ニクソン プロジェクトは、AI が人間の声を元の声と区別がつかないほどに再現できるという説得力のある例です。 MITの研究者、ジャーナリスト、アーティストのチームが、音声クローン会社RespeecherおよびVDR会社Canny AIと共同で、宇宙飛行士のニール・アームストロングとエドウィン・「バズ」・オルドリンがミッションを完了できずに月面に取り残された最初の月面探検のもう一つの歴史を作成した。 彼らはニクソン大統領の実際のビデオを改変して偽物を作成し、月面着陸は悲劇的な結末を迎えたと彼が世界に語るのを聞かせた。 ポッドキャストにおける人工知能の活用方法 コンピューター音声の主な課題は、ロボットのような音声を避けながら、人間の声や感情のニュアンスを再現することです。人工知能技術を活用した音声変換技術は、この目標を正確に達成する手段を提供します。
Apple の Siri、Amazon の Alexa、Microsoft の Cortana、Google Assistant などの仮想アシスタントは、依然としてテキスト読み上げ機能を使用しています。 TTS は今でも非常に便利なテクノロジーですが、音声を異なる音にするのは非常に複雑です。 たとえば、Siri を年配の男性のように話すには、事前に録音されたファイルに加えて、会話のすべての単語を含む新しいオーディオ ファイルが必要になります。音声から音声への変換がもたらすメリットをいくつか見てみましょう。 AI を使用してポッドキャスターの音声クローンを作成するにはどうすればよいでしょうか? AI によって音声クローンが可能になります。あらゆるポッドキャスト プロジェクトのあらゆるサウンドを完璧に再現するのに役立ちます。 「スマートカクテル」は通常、古典的なデジタル信号処理アルゴリズムと独自のディープ生成モデリング技術の 2 つの要素で構成されており、コンテンツ制作者は最も適切なサウンドを使用できます。 有名人をプロジェクトに招待する 俳優、作家、アスリートなどが有名になればなるほど、彼らをポッドキャストに出演させることは難しくなります。しかし、人工知能を使って人間の声を再現すれば、非常に忙しい人間がスタジオに到着するのを待つ必要はありません。聴衆をレコーディングスタジオに連れて行くために多くの時間と費用をかけなくても、聴衆にお気に入りのサウンドの録音を提供することができます。 昔の音を取り戻す たとえ俳優が亡くなっていたとしても、音声クローンはプロジェクトを希望通りに完成させるのに大いに役立ちます。亡くなる前のケネディ大統領に関する歴史的なポッドキャストを制作していますか? 音声変換テクノロジーを使用すると、近似声ではなく、大統領の正確な声を使用できます。 子どもの声を活用する 子どもたちは、必ずしも内容が面白いのではなく、単に言い方(口調、イントネーション、アクセントなど)が面白いという理由で、よくとても面白いことを言います。同時に、彼らと一緒に働くことは困難です。音声合成では、プロの俳優が子供とまったく同じように言葉を話すことで、このプロセスを簡素化できます。
画像ソース: unsplash · ポッドキャストプロジェクトが完了するまでスピードアップ 人工知能は人間の声を一瞬で再現することができます。必要なのは、対象となるサウンドの高品質な録音を提供することだけであり、それほど時間はかかりません。 2017年、ポッドキャストの広告収入は2億2000万ドルに達し、毎年倍増しています。潜在的な広告主を引き付ける主な要因は、ユーザーエンゲージメントの向上と、ポッドキャスト広告が約 90% の完了率で視聴可能であるという事実です。 さらに、広告主は特定のポッドキャスト スロットに対して最大 30 ドルの CPM (インプレッション 1,000 回あたりのコスト) を支払う用意があります。 Facebook の平均 CPM が 6 ドルであることを考慮すると、この数字はより納得がいきます。 ケーブルテレビは徐々にネットワークテレビに取って代わっており、ポッドキャストとラジオには多くの類似点があります。この類推をラジオ広告予算に限定したとしても、ポッドキャスト業界の現在の財政状況にさらに 200 億ドルの利益がもたらされることになります。冒頭で述べたように、リスナー数の増加は、利益の継続的な体系的な成長への期待を正当化します。
画像ソース: unsplash このような数字は、ポッドキャスティングが今後も定着し、オーディオ コンテンツの作成者を支援するより効果的な方法が切実に必要であることを明確に示しています。上に挙げた点は、AI が実現できることのほんの一部にすぎません。AI による音声クローン ポッドキャストは、業界全体を発展させ、編集の独立性の問題をより適切に処理することができます。 この記事はWeChatの公開アカウント「Reading the Core」から転載したもので、以下のQRコードからフォローできます。この記事を転載する場合は、Duxinshu の公開アカウントにご連絡ください。 |
<<: 5Gのサポートにより、AIの顔を変えること以外に人工知能は何ができるのでしょうか?
>>: マイクロソフトとパートナーは、AIへのアクセスを制限するデータ砂漠の縮小に取り組んでいる。
[[186930]]次に最も重要なテクノロジーは何でしょうか? 多くの人が「人工知能、VR、自動運...
まずは大学院入試から始めましょう。大学院入試の重要性は大学入試の重要性に匹敵します。数字で言うと、2...
今後 15 年間で、人工知能によって米国の雇用が 40% から 50% 減少すると私は予測しています...
ロボットに対する従来の印象は、四角くて冷たい機械、または人間に似た機械ですが、柔らかいロボット、特に...
PlaidML と呼ばれるこのツールを使用すると、NVIDIA、AMD、または Intel のグラフ...
スペイン紙エル・ムンドのウェブサイトが2月20日に報じたところによると、ソフトウェア、ハードウェア、...
[[440377]]はじめに12月7日、英国のドローン戦争ウェブサイトは、人工知能が各国の軍事部門に...
執筆者 | Yan Zheng制作:51CTO テクノロジースタック(WeChat ID:blog)...
翻訳者|朱 仙中レビュー | Chonglou導入信頼性の高いモデル評価はMLOP と LLMop ...