MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

  8月3日(東部時間8月2日)、Metaは、ユーザーがテキストプロンプトを通じて音楽やオーディオを作成できるようにする生成AIツールAudioCraftをオープンソース化しました。

写真3

Meta の公式紹介によると、AudioCraft には 3 つのコア コンポーネントが含まれています。

  • MusicGen: Meta が所有または特別にライセンスした音楽を使用してトレーニングし、テキストプロンプトに基づいて音楽を生成します。
  • AudioGen:トレーニング用のパブリック サウンド効果を使用してオーディオを生成したり、既存のオーディオを拡張したりします。また、環境音 (犬の鳴き声、車のクラクション、木製の床の足音など) も生成できます。
  • EnCodec (改良版):アーティファクトの少ない高品質の音楽を生成したり、オーディオ ファイルをロスレスで圧縮したりできる、ニューラル ネットワーク ベースのオーディオ圧縮デコーダーです。

MusicGen と AudioGen の動作を示すフローチャート

ツールがオープンソース化された後、研究者や実務者は独自のデータセットを使用してモデルをトレーニングできるようになります。同社によると、AudioCraftシリーズのモデルは、高品質のオーディオを安定して長期間生成でき、使いやすく、ミュージシャンやサウンドデザイナーに「インスピレーションを与え」、迅速なブレインストーミングを助け、「新しい方法で作業を繰り返す」ことができるという。

IT Homeの以前の報道によると、Metaは今年6月に、Googleが2017年に発表したTransformerモデルをベースにしたAI言語モデルMusicGenをオープンソース化した。モデル名が示すように、MusicGen は主に音楽生成に使用されます。テキストと既存のメロディーを完全な音楽に変換できます。

AudioCraftプロジェクトアドレス:ここをクリック

<<: 

>>:  スペイン・ラ・リーガ:AIと機械学習でファン体験の変革に取り組む

ブログ    
ブログ    

推薦する

IDC FutureScape: 人工知能がIT業界とビジネス運営を変革する

IDC は、2024 年以降の世界の情報技術業界の予測である FutureScape レポートを発表...

...

ニューラルネットワークの問題を解決するための新しいアイデア: OpenAI は線形ネットワークを使用して非線形問題を計算します

[[205570]]深層線形ネットワーク (浮動小数点演算を使用して実装) は実際には線形ではなく、...

...

AI Factory がコンセプトから産業化まで迅速かつ安全に移行する方法

[[374390]]人工知能 (AI) は、組織によって競争上の優位性を獲得するための重要なテクノロ...

ImageNetは人間の顔をぼかすことにしたが、ハスキー犬の顔の写真の認識率は急上昇した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

IDC:2026年までに国内市場の端末のほぼ半数がハードウェアレベルのAIエンジン技術を搭載

市場調査会社IDCは7月25日、近年の人工知能の急速な進化と発展により、ビッグデータモデルはますます...

...

2018 年の AI にとって重要なマイルストーンは何でしたか? 2019年に何が起こるでしょうか?

世界中で普及している人工知能は人類に利益をもたらすのでしょうか?それとも世界を破壊するのでしょうか?...

...

...

...

...

CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる

人生で、私たちは誰でもぼやけた画像に遭遇します。昔は、ぼやけた画像を復元することは不可能でした。PS...

AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

[[343105]] [51CTO.com クイック翻訳] サイバー脅威の複雑さと数は時代とともに進...