Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

これは間違いなく、生成 AI の進歩における画期的な出来事です。

深夜、Runway の象徴的な AI ビデオ生成ツール Gen-2 が、「iPhone の瞬間」のような壮大なアップデートを実施しました。

相変わらず簡単な文章入力ですが、今回は映像効果が超リアルな4Kレベルに!

では早速、爆発効果を見てみましょう。

今回のAI生成ビデオの効果は、これまでの「At a Glance AI」の欠点である、矛盾、ちらつき、変形、低解像度を克服していることは容易に理解できます。

そして、これがまさに Gen-2 のこの壮大なアップデートの焦点です。

これにより、テキストベースと画像ベースの両方のビデオの結果の忠実度と一貫性が大幅に向上します。

Runway は公式声明でこれを単に「アップデート」と表現したが、多くのネットユーザーはこれがメジャーバージョンの反復に相当すると考えている。

映像効果を見て、すでに多くの人が沸騰・燃えている状態です。

たとえば、ある AI 映画製作者はこれを「完全なゲームチェンジャー」と呼んだ。

別の生成AIの専門家も次のように考えています。

これは生成 AI にとって重要な瞬間です。

ご存知のとおり、Gen-2 が正式にリリースされてから (今年 6 月) わずか 4 か月しか経っていません。AI の進歩と反復のスピードにはため息が出ます。

公開アカウント「Digital Life Kha'Zix」は次のようにコメントしている。

地球上の1日はAI上の1年に相当します。

Gen-2 のこのメジャー アップデートは、Web サイトと APP で同時に実行されたことは注目に値します。

それでは、引き続き、新世代 Gen-2 の爆発的な効果を深く体験してみましょう。

コスト0で超大作を生み出す

現在、Web サイトで体験する場合でも、アプリで体験する場合でも、Gen-2 を使用している限り、生成されるビデオは最新の機能に基づいて作成されます。

ちょうど今、あるネットユーザーが Gen-2 をすぐに手に取り、ちょっとした歌と組み合わせて、あっという間に高級ファッション広告の大ヒット作を作り上げました。

この色、このモデル、そしてこの角度で、Gen-2 は広告の大ヒットをしっかりと捉えました。

以下のような、ハイエンドなMVショットのような動画もあります。

もう 1 つの例は、脳を刺激する創造的な SF 映画のクリップです。

正直に言うと、私たちはこれらの Gen-2 によって生成されたリアルな 4K ビデオにも魅了されました。

そこで私たちは自分たちで試してみることにしました。

操作は非常に簡単です。Runway の公式 Web サイトにアクセスし、「Text to Video」をクリックして、「Gen-2」を選択してテキスト入力インターフェイスに入ります。

テストしたテキストの内容は次のとおりです。

星間旅行、シュール。
スタートレック、シュールレアリズム。

数秒待つと、AIビデオが出てきました

正直に言うと、Gen-2 の結果は、私たちが当初想像していたものとは若干異なります (星空を背景にした宇宙船になると思っていました)。

しかし、その光景であろうと宇宙船のスタイルであろうと、人々に新鮮で独特な感覚を与えます。

これはクリエイティブな仕事をする人にとってはメリットです。インスピレーションが尽きたら、Gen-2 に考えを助けてもらいましょう。

画像から動画への変換機能に関しては、一部のネットユーザーは、トップクラスの AI 生成動画ツールである PIKA をGen-2 と比較しました。

全体的な結果から判断すると、Gen-2 は画像の鮮明さ、ビデオの滑らかさなどの点で現在優れています。

ちなみに、最新のGen-2を携帯電話で体験するのもとても便利ですよ〜

半年でゲームのルールを完全に書き換える

この画期的なアップデートでは新しい機能は追加されませんが、信頼性と一貫性の飛躍により、最新バージョンの Gen-2 は依然として画期的な製品となっています。

Gen-2 に関する関連論文はまだ発表されていないものの、Gen-1 の基本モデルを改良したものであることは確かです。

従来のテキスト制御拡散モデルと比較して、Gen はテキスト、画像、ビデオの混合トレーニング モデルを通じてトレーニング コストを削減しながら、生成されるビデオの品質と一貫性を向上させます。

同時に、Runway は遅延拡散モデルも提案しました。これは、事前トレーニング済みの拡散モデルにタイミング レイヤーを導入し、推論フェーズ中にモデルの時間的一貫性を高めるものです。

プロモーション ビデオでは、Runway は 3 セットの比較を使用して Gen-2 の大きな変更点を示しました。

公式発表はまだ具体的なテストデータを発表していないものの、Runwayが実施したユーザー調査では、Gen-1のユーザー嗜好がすでにStable Diffusion 1.5やText2Liveを上回っている。

Gen-2は今年3月にテストが開始され、6月に正式に一般にリリースされました。

既存のビデオ クリップとテキスト ガイダンスを組み合わせて合成された Gen-1 とは異なり、Gen-2 はテキストのみ、画像のみ、またはその両方の組み合わせを使用して生成できます。

さらに、Gen-1 のスタイル変換、マスキング、モデルのカスタマイズなどの機能も Gen-2 に保持されています。

半年前のリリース以来、Gen-2 はいくつかのアップデートが行われています。

8月に、RunwayはGen-2で生成される動画の最大長を4秒から18秒に延長しました。これはAI動画生成ツールとしては前例のない長さです。

9月にRunwayは、Gen-2に「カメラ」の位置と移動速度を制御できるディレクターモードが追加されたことを正式に発表しました。

その後まもなく、Gen-2 ではビデオ内の動きの範囲を調整できる新しい「モーション スライダー」機能が追加されました。

これらの大小さまざまなアップデートにより、このビデオ生成ツールは人気を博し、最終的には業界全体に衝撃を与えました。

創設者:クリエイティブソフトウェアは死んだ

Gen-2 のアップデートにより、映画、テレビ、クリエイティブ業界に大きな影響を与えました。

Runway の創設者兼 CEO である Cristóbal Valenzuela 氏は投稿の中で、「クリエイティブ ソフトウェアは死んだ」とさえ述べています。

ヴァレンズエラ氏はさらに、過去には人間が「ピクセルを手作業で操作」できたが、AI 作成ツールでは自然言語とパラメータ調整のみを使用して作品を完成させることができ、これは従来の (クリエイティブ) ソフトウェアではできないことだと説明した。

最後に、バレンズエラ氏は、刺激的な新しい(創造的な)時代が始まろうとしていると改めて強調した。

ヴァレンズエラの投稿には多くのネットユーザーが同意を表明し、これらのモデルは今すぐに塗装すべきだと述べた。

作者は直接賞賛はしなかったものの、過去に6か月かけて動画を作った経験を思い出し、まるですべてが自明であるかのように語ったという...

最後に、体験アドレスは以下です。興味のある方はぜひ行ってみてください〜

Gen-2 エクスペリエンス アドレス: https://research.runwayml.com/gen2。

参考リンク:[1] https://twitter.com/runwayml/status/1720064304374792615?s=20.

[2] https://twitter.com/hashtag/Gen2.

[3] https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/.

[4]https://mp.weixin.qq.com/s/jwKtx-wpSVVvAxhUTMXQBw.

<<:  北京大学のチームは、ChatGPTにとって頭痛の種であったアルゴリズムの最適化を解決し、普通のラップトップでも実行できるようにした。

>>:  ChatGPTはプログラミングの楽しさを殺している

ブログ    
ブログ    

推薦する

人工知能が注目を集め、ロボットキャスターが生放送の「新参者」に

北京ビジネスデイリー(陳偉記者) 知能ロボットは記者、シェフ、囲碁の達人になった後、最近は生放送業界...

新しいアルゴリズムによりクラウドデータベースのパフォーマンスが向上

Gigaom の Jordan Novet 氏の報告によると、MIT の研究者らは DBSeer と...

9つのディープラーニングアルゴリズムの紹介

1. 2段階アルゴリズム2 段階アルゴリズムには、候補ボックスの選択とターゲットの分類/位置の修正...

大規模モデルの観点から見た因果推論

1. 因果推論と大規模モデル近年、因果推論は研究のホットスポットとなり、多くのシナリオに適用されてき...

C#アルゴリズムのプログラム実装に関する面接の質問

C# アルゴリズムの面接の質問を解く方法はたくさんあります。ここでは 1 つだけ紹介します。まずは質...

ウェーディングビジョン:主要技術からインテリジェント機器へ

海はなぜ青いのでしょうか?この古くて神秘的な疑問は常に人々の興味をそそってきました。論文「水関連の視...

新しい顔認識ツール: 少ないデータでも「国際的な顔」を認識

最近、アマゾンの顔認識ツールが米国議会議員28名を犯罪者と誤って照合し、注目を集めた。顔認識ツールは...

今後 5 年間で最も収益性の高い業界は何ですか?人工知能を勝ち取る者はインターネットを勝ち取るのでしょうか?

[[221537]]今後 5 年間で最も価値のある起業の方向性は何でしょうか?どの起業分野を選択す...

野生生物の保護: ドローン、ロボット、AI

最近、雲南省の象の群れに関するニュースを皆さんも聞いたことがあると思います。 2020年、雲南省西双...

シリコンバレーのAI界で注目の記事:ジャスパーとVCはAIGCブームの最大の敗者となり、潮が引いた後に初めて誰が裸で泳いでいるかがわかる

この夏、人工知能起業家サム・ホーガンが書いた記事がシリコンバレー中で話題になった。現在、AI と大規...

AIOps の 7 つの主要機能

企業ネットワークが進化し続け、特にデジタル ビジネス アプリケーションへの移行が進むにつれて、サービ...

...

生成型 AI は急速な発展期を迎えています。その応用はどのように実装されるのでしょうか?

先月、国際的に有名な学術誌「ネイチャー」が2023年のトップ10を発表しました。世界的な科学イベント...

...

...