Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

これは間違いなく、生成 AI の進歩における画期的な出来事です。

深夜、Runway の象徴的な AI ビデオ生成ツール Gen-2 が、「iPhone の瞬間」のような壮大なアップデートを実施しました。

相変わらず簡単な文章入力ですが、今回は映像効果が超リアルな4Kレベルに!

では早速、爆発効果を見てみましょう。

今回のAI生成ビデオの効果は、これまでの「At a Glance AI」の欠点である、矛盾、ちらつき、変形、低解像度を克服していることは容易に理解できます。

そして、これがまさに Gen-2 のこの壮大なアップデートの焦点です。

これにより、テキストベースと画像ベースの両方のビデオの結果の忠実度と一貫性が大幅に向上します。

Runway は公式声明でこれを単に「アップデート」と表現したが、多くのネットユーザーはこれがメジャーバージョンの反復に相当すると考えている。

映像効果を見て、すでに多くの人が沸騰・燃えている状態です。

たとえば、ある AI 映画製作者はこれを「完全なゲームチェンジャー」と呼んだ。

別の生成AIの専門家も次のように考えています。

これは生成 AI にとって重要な瞬間です。

ご存知のとおり、Gen-2 が正式にリリースされてから (今年 6 月) わずか 4 か月しか経っていません。AI の進歩と反復のスピードにはため息が出ます。

公開アカウント「Digital Life Kha'Zix」は次のようにコメントしている。

地球上の1日はAI上の1年に相当します。

Gen-2 のこのメジャー アップデートは、Web サイトと APP で同時に実行されたことは注目に値します。

それでは、引き続き、新世代 Gen-2 の爆発的な効果を深く体験してみましょう。

コスト0で超大作を生み出す

現在、Web サイトで体験する場合でも、アプリで体験する場合でも、Gen-2 を使用している限り、生成されるビデオは最新の機能に基づいて作成されます。

ちょうど今、あるネットユーザーが Gen-2 をすぐに手に取り、ちょっとした歌と組み合わせて、あっという間に高級ファッション広告の大ヒット作を作り上げました。

この色、このモデル、そしてこの角度で、Gen-2 は広告の大ヒットをしっかりと捉えました。

以下のような、ハイエンドなMVショットのような動画もあります。

もう 1 つの例は、脳を刺激する創造的な SF 映画のクリップです。

正直に言うと、私たちはこれらの Gen-2 によって生成されたリアルな 4K ビデオにも魅了されました。

そこで私たちは自分たちで試してみることにしました。

操作は非常に簡単です。Runway の公式 Web サイトにアクセスし、「Text to Video」をクリックして、「Gen-2」を選択してテキスト入力インターフェイスに入ります。

テストしたテキストの内容は次のとおりです。

星間旅行、シュール。
スタートレック、シュールレアリズム。

数秒待つと、AIビデオが出てきました

正直に言うと、Gen-2 の結果は、私たちが当初想像していたものとは若干異なります (星空を背景にした宇宙船になると思っていました)。

しかし、その光景であろうと宇宙船のスタイルであろうと、人々に新鮮で独特な感覚を与えます。

これはクリエイティブな仕事をする人にとってはメリットです。インスピレーションが尽きたら、Gen-2 に考えを助けてもらいましょう。

画像から動画への変換機能に関しては、一部のネットユーザーは、トップクラスの AI 生成動画ツールである PIKA をGen-2 と比較しました。

全体的な結果から判断すると、Gen-2 は画像の鮮明さ、ビデオの滑らかさなどの点で現在優れています。

ちなみに、最新のGen-2を携帯電話で体験するのもとても便利ですよ〜

半年でゲームのルールを完全に書き換える

この画期的なアップデートでは新しい機能は追加されませんが、信頼性と一貫性の飛躍により、最新バージョンの Gen-2 は依然として画期的な製品となっています。

Gen-2 に関する関連論文はまだ発表されていないものの、Gen-1 の基本モデルを改良したものであることは確かです。

従来のテキスト制御拡散モデルと比較して、Gen はテキスト、画像、ビデオの混合トレーニング モデルを通じてトレーニング コストを削減しながら、生成されるビデオの品質と一貫性を向上させます。

同時に、Runway は遅延拡散モデルも提案しました。これは、事前トレーニング済みの拡散モデルにタイミング レイヤーを導入し、推論フェーズ中にモデルの時間的一貫性を高めるものです。

プロモーション ビデオでは、Runway は 3 セットの比較を使用して Gen-2 の大きな変更点を示しました。

公式発表はまだ具体的なテストデータを発表していないものの、Runwayが実施したユーザー調査では、Gen-1のユーザー嗜好がすでにStable Diffusion 1.5やText2Liveを上回っている。

Gen-2は今年3月にテストが開始され、6月に正式に一般にリリースされました。

既存のビデオ クリップとテキスト ガイダンスを組み合わせて合成された Gen-1 とは異なり、Gen-2 はテキストのみ、画像のみ、またはその両方の組み合わせを使用して生成できます。

さらに、Gen-1 のスタイル変換、マスキング、モデルのカスタマイズなどの機能も Gen-2 に保持されています。

半年前のリリース以来、Gen-2 はいくつかのアップデートが行われています。

8月に、RunwayはGen-2で生成される動画の最大長を4秒から18秒に延長しました。これはAI動画生成ツールとしては前例のない長さです。

9月にRunwayは、Gen-2に「カメラ」の位置と移動速度を制御できるディレクターモードが追加されたことを正式に発表しました。

その後まもなく、Gen-2 ではビデオ内の動きの範囲を調整できる新しい「モーション スライダー」機能が追加されました。

これらの大小さまざまなアップデートにより、このビデオ生成ツールは人気を博し、最終的には業界全体に衝撃を与えました。

創設者:クリエイティブソフトウェアは死んだ

Gen-2 のアップデートにより、映画、テレビ、クリエイティブ業界に大きな影響を与えました。

Runway の創設者兼 CEO である Cristóbal Valenzuela 氏は投稿の中で、「クリエイティブ ソフトウェアは死んだ」とさえ述べています。

ヴァレンズエラ氏はさらに、過去には人間が「ピクセルを手作業で操作」できたが、AI 作成ツールでは自然言語とパラメータ調整のみを使用して作品を完成させることができ、これは従来の (クリエイティブ) ソフトウェアではできないことだと説明した。

最後に、バレンズエラ氏は、刺激的な新しい(創造的な)時代が始まろうとしていると改めて強調した。

ヴァレンズエラの投稿には多くのネットユーザーが同意を表明し、これらのモデルは今すぐに塗装すべきだと述べた。

作者は直接賞賛はしなかったものの、過去に6か月かけて動画を作った経験を思い出し、まるですべてが自明であるかのように語ったという...

最後に、体験アドレスは以下です。興味のある方はぜひ行ってみてください〜

Gen-2 エクスペリエンス アドレス: https://research.runwayml.com/gen2。

参考リンク:[1] https://twitter.com/runwayml/status/1720064304374792615?s=20.

[2] https://twitter.com/hashtag/Gen2.

[3] https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/.

[4]https://mp.weixin.qq.com/s/jwKtx-wpSVVvAxhUTMXQBw.

<<:  北京大学のチームは、ChatGPTにとって頭痛の種であったアルゴリズムの最適化を解決し、普通のラップトップでも実行できるようにした。

>>:  ChatGPTはプログラミングの楽しさを殺している

推薦する

ディープラーニングツール: TensorFlow と NLP モデル

[[200204]]序文自然言語処理 (略して NLP) は、コンピューターが人間の言語を処理する方...

ガートナーの調査結果: CEO は AI を業界に最も大きな影響を与える破壊的技術と見なしている

「ジェネレーティブ AI はビジネスや運用モデルに多大な影響を及ぼすでしょう」と、ガートナーの著名な...

フェイフェイ・リーとチュンハン・デンが米国工学アカデミーに選出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

PytorchのNNモジュールと最初のニューラルネットワークモデルを実装する

PyTorch でモデルを構築します (主に NN モジュール)。 nn.リニアnn.Linear ...

...

ソラの13人のメンバーを解読:北京大学卒業生を含む中国人3人、博士号を取得したばかりの1人、そして21歳の天才

OpenAIはSoraで世界に衝撃を与えた。どのような才能あるチームがこのような傑作を開発できるので...

幾何学を利用してディープラーニングモデルのパフォーマンスを向上させることは、コンピュータービジョン研究の未来です。

[[189965]]ディープラーニングはコンピュータービジョンを変革しました。現在、ほとんどの問題...

...

BAIRの最新のRLアルゴリズムはGoogle Dreamerを上回り、パフォーマンスが2.8倍向上しました。

ピクセルベースの RL アルゴリズムが復活しました。BAIR は対照学習と RL を組み合わせたアル...

人工知能の時代においても、人間同士の交流は依然として重要である

実際、AI はほとんどの人間同士のやり取りに取って代わっています。デジタルアシスタントや AI ベー...

...

AIチップアーキテクチャは最先端へ向かう

企業は、AI をエッジに押し上げるための最適な武器として、さまざまなチップ アーキテクチャを採用しよ...

[NCTS サミットレビュー] Li Yuanchun: 自動テストにおける強化学習の応用

2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...

...