Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

これは間違いなく、生成 AI の進歩における画期的な出来事です。

深夜、Runway の象徴的な AI ビデオ生成ツール Gen-2 が、「iPhone の瞬間」のような壮大なアップデートを実施しました。

相変わらず簡単な文章入力ですが、今回は映像効果が超リアルな4Kレベルに!

では早速、爆発効果を見てみましょう。

今回のAI生成ビデオの効果は、これまでの「At a Glance AI」の欠点である、矛盾、ちらつき、変形、低解像度を克服していることは容易に理解できます。

そして、これがまさに Gen-2 のこの壮大なアップデートの焦点です。

これにより、テキストベースと画像ベースの両方のビデオの結果の忠実度と一貫性が大幅に向上します。

Runway は公式声明でこれを単に「アップデート」と表現したが、多くのネットユーザーはこれがメジャーバージョンの反復に相当すると考えている。

映像効果を見て、すでに多くの人が沸騰・燃えている状態です。

たとえば、ある AI 映画製作者はこれを「完全なゲームチェンジャー」と呼んだ。

別の生成AIの専門家も次のように考えています。

これは生成 AI にとって重要な瞬間です。

ご存知のとおり、Gen-2 が正式にリリースされてから (今年 6 月) わずか 4 か月しか経っていません。AI の進歩と反復のスピードにはため息が出ます。

公開アカウント「Digital Life Kha'Zix」は次のようにコメントしている。

地球上の1日はAI上の1年に相当します。

Gen-2 のこのメジャー アップデートは、Web サイトと APP で同時に実行されたことは注目に値します。

それでは、引き続き、新世代 Gen-2 の爆発的な効果を深く体験してみましょう。

コスト0で超大作を生み出す

現在、Web サイトで体験する場合でも、アプリで体験する場合でも、Gen-2 を使用している限り、生成されるビデオは最新の機能に基づいて作成されます。

ちょうど今、あるネットユーザーが Gen-2 をすぐに手に取り、ちょっとした歌と組み合わせて、あっという間に高級ファッション広告の大ヒット作を作り上げました。

この色、このモデル、そしてこの角度で、Gen-2 は広告の大ヒットをしっかりと捉えました。

以下のような、ハイエンドなMVショットのような動画もあります。

もう 1 つの例は、脳を刺激する創造的な SF 映画のクリップです。

正直に言うと、私たちはこれらの Gen-2 によって生成されたリアルな 4K ビデオにも魅了されました。

そこで私たちは自分たちで試してみることにしました。

操作は非常に簡単です。Runway の公式 Web サイトにアクセスし、「Text to Video」をクリックして、「Gen-2」を選択してテキスト入力インターフェイスに入ります。

テストしたテキストの内容は次のとおりです。

星間旅行、シュール。
スタートレック、シュールレアリズム。

数秒待つと、AIビデオが出てきました

正直に言うと、Gen-2 の結果は、私たちが当初想像していたものとは若干異なります (星空を背景にした宇宙船になると思っていました)。

しかし、その光景であろうと宇宙船のスタイルであろうと、人々に新鮮で独特な感覚を与えます。

これはクリエイティブな仕事をする人にとってはメリットです。インスピレーションが尽きたら、Gen-2 に考えを助けてもらいましょう。

画像から動画への変換機能に関しては、一部のネットユーザーは、トップクラスの AI 生成動画ツールである PIKA をGen-2 と比較しました。

全体的な結果から判断すると、Gen-2 は画像の鮮明さ、ビデオの滑らかさなどの点で現在優れています。

ちなみに、最新のGen-2を携帯電話で体験するのもとても便利ですよ〜

半年でゲームのルールを完全に書き換える

この画期的なアップデートでは新しい機能は追加されませんが、信頼性と一貫性の飛躍により、最新バージョンの Gen-2 は依然として画期的な製品となっています。

Gen-2 に関する関連論文はまだ発表されていないものの、Gen-1 の基本モデルを改良したものであることは確かです。

従来のテキスト制御拡散モデルと比較して、Gen はテキスト、画像、ビデオの混合トレーニング モデルを通じてトレーニング コストを削減しながら、生成されるビデオの品質と一貫性を向上させます。

同時に、Runway は遅延拡散モデルも提案しました。これは、事前トレーニング済みの拡散モデルにタイミング レイヤーを導入し、推論フェーズ中にモデルの時間的一貫性を高めるものです。

プロモーション ビデオでは、Runway は 3 セットの比較を使用して Gen-2 の大きな変更点を示しました。

公式発表はまだ具体的なテストデータを発表していないものの、Runwayが実施したユーザー調査では、Gen-1のユーザー嗜好がすでにStable Diffusion 1.5やText2Liveを上回っている。

Gen-2は今年3月にテストが開始され、6月に正式に一般にリリースされました。

既存のビデオ クリップとテキスト ガイダンスを組み合わせて合成された Gen-1 とは異なり、Gen-2 はテキストのみ、画像のみ、またはその両方の組み合わせを使用して生成できます。

さらに、Gen-1 のスタイル変換、マスキング、モデルのカスタマイズなどの機能も Gen-2 に保持されています。

半年前のリリース以来、Gen-2 はいくつかのアップデートが行われています。

8月に、RunwayはGen-2で生成される動画の最大長を4秒から18秒に延長しました。これはAI動画生成ツールとしては前例のない長さです。

9月にRunwayは、Gen-2に「カメラ」の位置と移動速度を制御できるディレクターモードが追加されたことを正式に発表しました。

その後まもなく、Gen-2 ではビデオ内の動きの範囲を調整できる新しい「モーション スライダー」機能が追加されました。

これらの大小さまざまなアップデートにより、このビデオ生成ツールは人気を博し、最終的には業界全体に衝撃を与えました。

創設者:クリエイティブソフトウェアは死んだ

Gen-2 のアップデートにより、映画、テレビ、クリエイティブ業界に大きな影響を与えました。

Runway の創設者兼 CEO である Cristóbal Valenzuela 氏は投稿の中で、「クリエイティブ ソフトウェアは死んだ」とさえ述べています。

ヴァレンズエラ氏はさらに、過去には人間が「ピクセルを手作業で操作」できたが、AI 作成ツールでは自然言語とパラメータ調整のみを使用して作品を完成させることができ、これは従来の (クリエイティブ) ソフトウェアではできないことだと説明した。

最後に、バレンズエラ氏は、刺激的な新しい(創造的な)時代が始まろうとしていると改めて強調した。

ヴァレンズエラの投稿には多くのネットユーザーが同意を表明し、これらのモデルは今すぐに塗装すべきだと述べた。

作者は直接賞賛はしなかったものの、過去に6か月かけて動画を作った経験を思い出し、まるですべてが自明であるかのように語ったという...

最後に、体験アドレスは以下です。興味のある方はぜひ行ってみてください〜

Gen-2 エクスペリエンス アドレス: https://research.runwayml.com/gen2。

参考リンク:[1] https://twitter.com/runwayml/status/1720064304374792615?s=20.

[2] https://twitter.com/hashtag/Gen2.

[3] https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/.

[4]https://mp.weixin.qq.com/s/jwKtx-wpSVVvAxhUTMXQBw.

<<:  北京大学のチームは、ChatGPTにとって頭痛の種であったアルゴリズムの最適化を解決し、普通のラップトップでも実行できるようにした。

>>:  ChatGPTはプログラミングの楽しさを殺している

推薦する

イェール大学教授を征服したアルゴリズムプログラマーを見て、「人間本位」を実践してスマートコミュニティの脳を開発するにはどうすればよいのでしょうか?

自宅の高齢者が階段を降りる途中で誤って転倒したり、地域でいたずらっ子が走り回ってトラブルを起こしたり...

人工知能とビッグデータが心理学の分野に参入

人工知能とビッグデータの時代の到来により、心理学の研究に新たな扉が開かれました。人工知能は心理学実験...

デジタルヒューマンとは何か、そしてその将来性はどのようなものでしょうか?

今日の技術的に進歩した世界では、生きているようなデジタルヒューマンが大きな関心を集める新たな分野とな...

日本政府は国民が人生のパートナーを見つけるのを支援するためにAI技術を活用することを計画している

完璧なパートナーを見つけることは、特に新型コロナウイルスによるロックダウンや隔離により対面でのコミュ...

今年のダブルイレブンでは、ドローン、無人運転車、ロボットがすべて配備されます!

近年、科学技術革命と産業変革の新たな局面の始まりに伴い、わが国の物流業界は情報化、デジタル化、インテ...

Llama 2 第 2 波のハイライト: 慎重すぎるため、コード生成には改善の余地が大いにある

有用か無害かLlama-2-chat は、セキュリティ フィルターに関して過度に敏感な動作を示すこと...

再編とリーダーシップ:デジタルとAIのリーダーが他を置き去りにしている

デジタルおよび AI リーダーと他の業界プレーヤーとの間のギャップは大きく、さらに広がっています。過...

ビッグデータと人工知能の時代において、監査人は依然としてアイデアを持つ必要があるのでしょうか?

誰もが考えを持っており、監査人もそれぞれ心の中にさまざまな考えを持っています。表面的には、監査スキル...

人工知能がサイバーセキュリティに及ぼす3つの影響

人工知能 (AI) と機械学習 (ML) は、人々の働き方、話し方、ビジネスのやり方を根本的に変えて...

大学を解雇され、Facebookも拒否した大物音声エンジニアのダニエル・ポーヴィー氏が、中国のXiaomiに入社する

昨日、小米集団の創業者、雷軍氏は微博で、音声認識とAIの国際的専門家であり、音声認識オープンソースツ...

...

...

アリババのロボットが200語のエッセイを修正し、8つの間違いを発見

最近、浙江外国語大学国際学院で、アリババAIが試験の採点を完了し、200語のエッセイに8つの誤りを発...

...