Google、かわいい動物動画生成に優れたAI動画ジェネレータ「Lumiere」をリリース

Google、かわいい動物動画生成に優れたAI動画ジェネレータ「Lumiere」をリリース

海外メディアの報道によると、1月26日、GoogleはLumiereと呼ばれる人工知能ビデオジェネレータを発表し、関連するプレプリント論文の中でこれを「リアルなビデオ生成のための時空間拡散モデル」と呼んだ。 Lumiere は、ローラースケートを履いたり、車を運転したり、ピアノを弾いたりといったおかしな状況にいるかわいい動物たちのビデオをうまく作成しています。

Google によれば、Lumiere は独自のアーキテクチャを活用して、ビデオの全期間を一度に生成します。あるいは、同社の言葉を借りれば、「モデルを 1 回通過するだけで、ビデオの全時間継続時間を瞬時に生成できる時空間 U-Net アーキテクチャを導入します」。これは、離れたキーフレームを合成し、その後に時間的超解像を行う既存のビデオ モデルとは対照的であり、このアプローチでは、本質的に全体的な時間的一貫性を実現することが困難です。 ”

簡単に言えば、Google のテクノロジーは、空間的側面 (ビデオ内のオブジェクトの位置) と時間的側面 (ビデオ内でオブジェクトがどのように移動し変化するか) の両方を同時に処理するように設計されています。そのため、多くの小さな部分やフレームを組み合わせてビデオを作成するのではなく、最初から最後まで 1 つのスムーズなプロセスでビデオ全体を作成できます。

Lumiere はさまざまなパーティー トリックも実行できます。Google のデモ ページには、この優れた例が掲載されています。たとえば、テキストからビデオへの生成 (書かれたプロンプトをビデオに変換する)、静止画像をビデオに変換する、参照画像を使用して特定のスタイルでビデオを生成する、テキストベースのプロンプトを使用して一貫したビデオ編集を適用する、画像の特定の領域をアニメーション化して映画のようなグラフィックを作成する、ビデオ ペイント機能 (たとえば、人が着ている服の種類を変更する) を提供するなどの機能があります。

ルミエールの研究論文の中で、グーグルの研究者らは、AIモデルが1024×1024ピクセルの5秒間の動画を出力し、それを「低解像度」と呼んでいると述べた。こうした制限にもかかわらず、研究者らはユーザー調査を実施し、Lumiere の出力は既存の AI ビデオ合成モデルよりも人気があると主張しています。

<<:  トラフィックエンジニアリングによりコード生成の精度が2倍に向上: 19%から44%

>>: 

ブログ    
ブログ    

推薦する

頻繁にミスを犯す自動運転車は「ドメイン適応」が欠如している可能性がある

6月に開催されるCVPR 2019は、マシンビジョン分野で最も重要な学術会議です。選考結果が発表され...

モデルの好みはサイズだけですか?上海交通大学は32の大規模モデルについて人間の嗜好の定量的要素を包括的に分析した。

現在のモデルトレーニングパラダイムでは、嗜好データの取得と使用が不可欠な部分になっています。トレーニ...

...

詳細な分析: AI LLM フレームワークの通信モジュール - なぜそれがコア モジュールなのか

この記事は、AI LLMフレームワークアーキテクチャシリーズの第2弾です。通信モジュール人工知能 (...

Pytorch の核心であるモデルの定義と構築を突破しましょう! ! !

こんにちは、Xiaozhuangです!今日はモデルの定義と構築についてお話ししましょう。初心者に最適...

機械学習について知っておくべき6つの革命的な教訓

私たちは、ロボット工学、スマート家電、スマート小売店、自動運転車技術などによって推進される新しい時代...

研究報告によると、GPT-4の「知能」は大幅に低下している

7月20日、スタンフォード大学とカリフォルニア大学バークレー校の研究チームが最近GPT-4の詳細な研...

人工知能がメンタルヘルスの改善に役立つ4つの方法

[51CTO.com クイック翻訳] 私たちはメンタルヘルスの危機を経験しています。世界人口の約 1...

...

30歳以下の人はどこへ行ってしまったのでしょうか? OpenAIは若者を引き付けるために懸命に努力している

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)ビル・ゲイ...

人工知能の実例5つ

ここでは、AI が日常生活で非常に正確に使用されている 5 つのベスト例を紹介します。人工知能 (A...

エンタープライズ AI の 4 つのトレンド: 現在地と今後の方向性

[[275946]]ビッグデータダイジェスト制作出典: フォーブス編纂者:張大毓人工知能は従来の産業...

「百度脳産業イノベーションフォーラム」が本格始動、伝統産業向けAIソリューションを提案

「将来、AIとは何の関係もないと主張する企業はなくなるだろう」これは、2018年の世界人工知能会議で...

...

カスタマー サービス チーム向けの人工知能と機械学習ツール

どのビジネスリーダーも、顧客サービスがビジネスの最優先事項になっていることを認めるでしょう。同社は、...