安定拡散当局はついにこのビデオに対して行動を起こした―― 生成ビデオモデルStable Video Diffusion (SVD)をリリースしました。 Stability AI の公式ブログによると、新しい SVD はテキストからビデオへの生成と画像からビデオへの生成をサポートしているそうです。 また、オブジェクトを単一の視点から複数の視点に変換する、つまり3D 合成もサポートしています。 外部の評価によると、SVDはRunwayやPikaの動画生成AIよりもユーザーに人気があると公式は主張している。 現時点では基本モデルのみが公開されているが、担当者は「今後も拡大を続け、Stable Diffusionと同様のエコシステムを構築する計画がある」と明かした。 紙のコード重量がオンラインになりました。 最近、動画生成の分野では新しい遊び方が次々と登場しています。今回はStable Diffusionの番です。ネットユーザーの第一反応は「速い」で、進歩が速すぎるほどです。 しかし、デモの影響だけから判断すると、あまり驚かないというネットユーザーの方が多かった。 私は SD が大好きで、これらのデモは素晴らしいのですが... いくつか欠陥があり、照明がオフで、全体的に途切れ途切れの要素(ビデオ フレーム間のちらつき)があります。 全体として、これはまだ始まりに過ぎず、ネットユーザーは SVD の 3D 合成機能について非常に楽観的です。 すぐにもっと良いものが登場するでしょう。説明するだけで完全な 3D シーンが得られるのです。 SDビデオ正式版が登場上記に加えて、公式ではさらに多くのデモもリリースされています。まずはそれらを見てみましょう。 宇宙遊泳も計画されています。 背景を静止したまま、2羽の鳥だけを動かすこともできます。 SVDに関する研究論文も公開されています。SVDはStable Diffusion 2.1をベースにしており、約6億サンプルのビデオデータセットで基本モデルを事前トレーニングしたと報告されています。 マルチビュー データセットを微調整することで、単一の画像からマルチビューを合成するなど、さまざまな下流タスクに簡単に適応できます。 微調整の後、公式発表では、3~30 fps のカスタム フレーム レートで 14 fps (SVD) および 25 fps (SVD-XT) のビデオを生成できる 2 つの画像からビデオへのモデルが発表されました。 その後、SVD-MV と呼ばれるマルチビュー ビデオ生成モデルを微調整しました。 テスト結果によると、GSO データセットでは、SVD-MV はマルチビュー生成モデル Zero123、Zero123XL、SyncDreamer よりも優れたスコアを獲得しました。 なお、Stability AI は、SVD は現在研究に限定されており、実用的または商業的なアプリケーションには適していないと述べています。 SVD はまだすべての人が利用できるわけではありませんが、ユーザー待機リストへの登録は開始されています。 ビデオ世代の爆発的増加最近、ビデオ生成の分野ではちょっとした無差別競争が起きています。 以前は、 PikaLabsによって開発された Vincent Video AI がありました。 その後、史上最強の動画生成AIと言われるMoonvalleyが発売されました。 最近、Gen-2 の「モーション ブラシ」機能が正式にリリースされ、指した場所に何でも描画できるようになりました。 現在ではSVDが再び登場し、再び3Dビデオを生成できるようになりました。 しかし、テキストから3D生成に関してはあまり進歩がないようで、ネットユーザーもこの現象に困惑している。 データは開発を妨げるボトルネックであると考える人もいます。 一部のネットユーザーは、強化学習が十分に強力ではないことが理由だと述べた。 家族はこの件に関する最新の動向を知っていますか?コメント欄でのシェアを歓迎します〜 論文リンク: https://static1.squarespace.com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf |
>>: ChatGPTの最強のライバルのアップデート!コンテキストの長さは 2 倍になり、API 価格は 30% 近く下がりました。
[[223220]]世界経済フォーラムの最近のレポートでは、2020年までに先進国で500万の雇用...
今日の人工知能、ビッグデータ、自動化の時代では、技術的なスキルとデータリテラシーが非常に重要です。し...
夏が来ると、人類の最大の敵の一つである蚊が活発になります。彼らは2~3匹で「家に侵入」し、「ブンブン...
人工知能は現在非常に人気の高い技術であり、世界中の国々が研究に資金と人材を投入しています。人工知能を...
[[353168]]記者趙光麗最近、中国科学院自動化研究所(以下、自動化研究所)は、「妙算智慧」戦術...
人間も他の動物も、目覚めるたびに過去の記憶を整理し、新しい記憶を迎える準備をします。私たちは、以前の...
[[216201]]人工知能は2017年に一連の画期的な成果を達成しました。 2018年、人工知能は...
ブロックチェーン暗号化入門ブロックチェーン暗号化技術ブロックチェーン技術の応用と発展において、デジタ...
フォーチュン 500 にランクされる世界的なテクノロジー サービス企業 DXC Technology...
7月4日、コード生成に重点を置いたAIモデルとしてMetaGPTが発表された。名前は似ているが、Me...
ストレージ インフラストラクチャに人工知能を導入することで、容量とパフォーマンスの要件が高まっていま...
階段を登れるロボットが必要になったとしたら、このロボットはどのような形状であるべきでしょうか?人間の...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
[[401368]]専門家の皆さん、ゲストの皆さん、こんにちは。今日は主に、Pengcheng Bi...