Google Deepmind、楽器とボーカルで音楽を生成するLyria AIオーディオモデルを発表

Google Deepmind、楽器とボーカルで音楽を生成するLyria AIオーディオモデルを発表

11月21日、Deepmindは楽器とボーカルで音楽を生成できるLyriaというオーディオモデルをリリースした。さらに、DeepmindはYouTubeと協力してLyriaモデルを統合し、音楽制作ツールDream Trackを開発しており、これによりビデオクリエイターが「アイデアをより効率的に作品にすることができる」と主張している。

研究者らは、AI モデルを通じて音楽を生成する際の現在の課題について説明しました。これは、音楽自体に極めて高い情報密度が含まれており、1 秒ごとに複数のビート、音符、ハーモニーが可能であるためです。これにより、「音楽の生成」は「言語の生成(テキスト読み上げ)」よりも複雑になり、AI モデルが長い音楽シーケンスの連続性を維持することも難しくなります。これは、モデルがさまざまなフレーズ、詩、長い段落で音楽の流暢さと一貫性を維持する必要があるためです。

さらに、音楽クリップには複数の音声や楽器が同時に含まれていることが多いため、音楽生成の難易度がさらに高まります。関連するオーディオ モデルは、生成された音楽をより自然にするために、複数のサウンドとメロディーを調整できる必要があります。

Deepmindが開発したLyria AIモデルは、上記の問題点を解決する試みです。このモデルの最大の特徴は、楽器やボーカルも含めた高品質な音楽を生成できる点です

▲ 画像出典:Deepmind

さらに、Lyria モデルは音楽の変換と継続のタスクの実行にも優れているため、既存の音楽作品に基づいて斬新なスタイルや統一されたスタイルを持つ後続の音楽作品を生成することもできます。

研究者らはまた、Lyria モデルにはユーザーが音楽スタイルや表現を正確に生成できる詳細な微調整オプションがあるため、このモデルは「プロの音楽制作のニーズを満たすと同時に、アマチュアユーザーが簡単に始められる」とも強調した。

▲ 画像出典:Deepmind

IT Homeは、YouTubeがすでに短編動画機能「Shorts」にLyriaモデルを適用しており、その成果がYouTubeの実験的な音楽制作ツール「Dream Track」に統合されていると指摘した。ユーザーはこのツールを使って多様なサウンドトラックを生成し、Charlie Puth、Charli XCX、Siaなどのアーティストの音楽スタイルを選択して「新しい解釈」を生み出すことができる。

▲ 画像出典:Deepmind

ユーザーは Dream Track にテーマを入力し、アーティストを選択するだけで、30 秒のサウンドトラック、歌詞、伴奏、その他の短編ビデオ用コンテンツが生成されるとのことです。

▲ 画像出典:Deepmind

▲ 画像出典:Deepmind

さらに、Deepmindは、研究者が音楽制作の分野でAIの応用を幅広く研究しているとも述べています。将来的には、ユーザーはハミングするだけで、AIがメロディーを歌詞付きの完全な曲にマッチさせます。また、古いMIDI音楽をリミックスバージョンに変換したり、オーディオトラックにさまざまな楽器の伴奏を追加したりすることもできます。

Deepmind はまた、Lyria モデルによって生成されたすべてのコンテンツに SynthID 透かしが付けられると述べました。これは、楽曲がAIによって生成されたものであるかどうかを識別するための透かしの仕組みです。AIが生成した音楽に、聴取体験に影響を与えることなく「リスナーには知覚できない透かしマーク」を埋め込むことができると主張しています。

▲ 画像出典:Deepmind

研究者らは、「サウンド ウォーターマーク」付きのオーディオは、ノイズが追加されたり、MP3 圧縮が行われたり、ピッチや速度が変更されたりしても検出可能であると述べています。Lyria モデルは、曲内の SynthID を検出することで、Lyria モデルによって生成された曲の部分を確認することもできます。これにより、音楽のテーマ コンテンツを識別しやすくなり、後続のミュージック クリップの生成が容易になります。

<<:  研究者は特別な画像を使って人工知能を「毒する」

>>:  JetBrainsが2023年の調査レポートを発表:Rustの人気はますます高まり、開発者の77%がChatGPTを使用

ブログ    
ブログ    

推薦する

プログラマーがマスターになるためのプログラミングアルゴリズムトップ10

アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hall によって開発された...

人工知能が登場して60年になります。人工知能について私たちはどんな誤解をしているのでしょうか?

8月23日、百度のCEOであるロビン・リー氏は中国国際知能産業博覧会で講演し、一般の人々は人工知能...

C言語の非数値計算でよく使われる5つの古典的なソートアルゴリズム

概要: ソートとは、一連の「順序付けられていない」レコードシーケンスを「順序付けられた」レコードシー...

...

集中治療室における人工知能の未来

他の業界と同様に、ヘルスケアにおける AI の応用と議論は幅広く行われています。 AIはすでに診断の...

3つの主要なSQL ServerアルゴリズムのI/Oコストの簡単な分析

1. ネストループ結合アルゴリズム:考え方は非常に単純かつ直接的です。関係 R の各タプル r を、...

人工知能とモノのインターネットのダイナミックな融合を探る(パート 2)

前回の記事「人工知能とモノのインターネットの動的統合を探る(I) 」の続き1. IoTにおけるAIの...

KServe、Kubernetes環境に基づく高度にスケーラブルな機械学習デプロイメントツール

ChatGPT のリリースにより、機械学習技術の活用を避けることがますます難しくなってきています。メ...

...

アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

機械学習の進歩がモデルによってもたらされるのか、それともデータによってもたらされるのかは、今世紀の論...

...

AIアルゴリズムは携帯電話の画像プロセッサを置き換え、携帯電話で一眼レフのような写真を撮ることができる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

サービスロボット市場の最前線に立つセキュリティは注目に値する

現在、サービスロボットは中国のロボットが他のロボットを追い抜く重要なチャンスとみなされており、あらゆ...