Pika 1.0 はアニメーション業界に完全な革命をもたらします!ドリームワークスの創設者は、3年後にはアニメーションのコストが10分の1に下がると予測

Pika 1.0 はアニメーション業界に完全な革命をもたらします!ドリームワークスの創設者は、3年後にはアニメーションのコストが10分の1に下がると予測

最近、ドリームワークスの創設者ジェフリー・カッツェンバーグ氏は、生成AIの技術がメディアとエンターテインメント業界に完全な混乱をもたらし、今後3年間でアニメーション映画のコストが90%削減されると予測しました。

「歴史的に見ると、ペン、絵筆、印刷機、スチールカメラ、映画カメラ、これらは創造性と物語の伝え方を驚異的な方法で拡大してきました。そして、私たちは以前にもこの軌跡を見てきました。」

「メディア、エンターテインメント、クリエイティブライティング以上に生成AIの影響を受ける業界を私は知らない」と彼は語った。

「一方で、これは混乱を招き、アーティストやストーリーテラーにとって今日ではアクセスしにくいものをコモディティ化することになると思います。」

「私がアニメ映画を制作していた頃は、世界クラスのアニメ映画を制作するのに500人のアーティストが5年かかっていました。今後3年間で、そのコストは10%に削減されると思います。」

「私の意見では、個人の創造性が将来すべてを決定するでしょう。」

彼が言ったように、AIビデオの分野では技術が日々飛躍的に進歩しています。

Pika 1.0を使用すると、ユーザーはわずか数分でディズニーレベルの短編アニメーションを作成できます。

数日前にネット上で話題になったPika Labsが正式版1.0をリリースしました。

最初の公式ビデオで披露されたアニメーション効果は、ディズニーなどのアニメーション映画会社のクオリティーに到達したと言っても過言ではない。

ドリームワークスの創業者がそのような予測をしたのも不思議ではない。おそらく、ピカのような未来志向のアニメーションツールが、業界革命の夜明けを予見させたのであろう。

動画を見ると、1ショットあたりの時間は長くないにもかかわらず、アニメキャラクターの一貫性や画像の質感は大手アニメ会社が制作したアニメとあまり変わらないことがわかります。

Pika 1.0が招待体験を開始して以来、オンラインで公開される事例が増えてきました。 Pika 1.0 で作成されたこれらのアニメーションを見ると、3 年後の 90% の予測は少し控えめすぎるように思えます。

ロボットがクリスマスを祝うこのアニメーションでは、カメラが頻繁に切り替わることを除けば、明らかな問題を見つけるのはほとんど困難です。

ロボットの複数のショットは非常に一貫性があり、ショット後に主人公が完全に変わるという以前の AI アニメーションの欠陥はなくなりました。

このロボットはセリフを一つも話さないが、それでも観客に簡単なストーリーを伝えている。これを基に良いストーリーを展開すれば、AIアニメーション短編映画が完成します。

作者によると、このアニメーションはPika 1.0の発売を祝うためのものだそうです。

アニメーションにはシンプルな夜景しかありませんが、花火の効果の一貫性は非常に良く、夜の街の光と影も多様で、効果が華やかです。

さらに、さまざまなショットがうまく配置されており、雰囲気が非常によく表現されています。

このアニメーションから、顔の歪みの問題がPikaによってほぼ解決されていることがわかります。

キャラクターの顔の動きは明確ではありませんが、非常に優れた一貫性を保っており、これまでの AI アニメーションの最大の欠点が大幅に改善されています。

このアニメーションは「AIショートムービー」ともいえるでしょう。

夕日の中、ジャックがタイタニック号の上に立っており、彼の隣のローズがかわいいジャイアントパンダに置き換えられていますが、その効果は驚くほどまったく違和感がありません。

最後に大きく「To Be Continued」とあるのは、未来のAIアニメ業界の物語がまだ始まったばかりであることを暗示している。

アニメーション制作の敷居がさらに下がれば、美しいストーリーを持つすべてのクリエイターが創造力を存分に発揮し、素晴らしいストーリーを表現できるほど洗練された動画を制作できるようになるかもしれません。

Gen-2ではダイナミックブラシが導入され、ユーザーはより高度な制御が可能になりました。

Gen-2では、動画内のダイナミックな効果をユーザーが自由に決められる「モーションブラシ」が導入されました。わずか数日間でツイートが160万回以上読まれました。

伝説の「馬良の魔法筆」のように、ユーザーはマウスをドラッグするだけで静止画像を思い通りに動かすことができます。

背景の動きでも、写真内の特定の風景や人物の動きでも、自然な動きの効果を生み出すことができます。

写真に写っている車、煙、滝、炎、人物など、すべてが自然に動きます。

湖、船、人々、水槽の中の金魚、すべてが動き始めます。

ユーザーに動的効果に対する強力な制御を与えることで、アニメーションやビデオの制作コストが大幅に削減されると考えられます。

将来的には、普通の人でも、文章を書くのと同じように、数枚の写真と数時間を使って、自分だけの創作ビデオを動的に生成できるようになるかもしれません。

5秒で3Dマテリアルを生成

アニメーション コンテンツ制作のもう 1 つの分野である 3D モデリングも、AI テクノロジーの推進力によって絶えず革新を続けています。

Adobe とオーストラリア国立大学の研究者が最近発表した論文では、2D 画像を使用して 3D マテリアルを直接生成する技術が提案され、業界に大きな衝撃を与えました。

プロジェクトアドレス: https://yiconghong.me/LRM/

著者らは、彼らのモデルは与えられた 2D 画像をわずか 5 秒で 3D 素材に変換できると述べています。

通常の 3D 素材に加え、モデルを使用してインタラクティブな 3D 素材も生成できます。

Transformer アーキテクチャに基づくこの 3D モデルには 5 億個のパラメータがあり、入力画像からわずか 5 秒で 3D モデルを予測し、データセットから直接神経放射場 (NeRF) を予測できます。

研究者らは、Objaverse からの合成レンダリングや MVImgNet からの実際のキャプチャを含む、約 100 万個のオブジェクトの大規模なマルチビュー データを使用して、エンドツーエンド方式でモデルをトレーニングしました。

大容量モデルと大規模なトレーニング データの組み合わせにより、モデルの一般化が高度化されます。

3D モデリング技術の継続的な発展により、おそらく Pika 1.0 の瞬間もそう遠くないと思います。

その時、ソーシャルメディアの出現がセルフメディアや情報発信のあり方に大きな変化をもたらしたように、AIアニメーションがアニメーション制作の敷居を大きく下げると、映像メディア爆発の時代を迎えることになるでしょう。

<<:  ByteDance の新しい具現化された知能の成果: 大規模なビデオデータでトレーニングされた GR-1 は、複雑なタスクを簡単に処理します

>>: 

ブログ    

推薦する

人工知能の10年を振り返る: CNN、AlphaGo…世界をどのように変えたか

過去 10 年間に AI で達成された重要な進歩を振り返ります。人工知能技術は過去 10 年間で飛躍...

ビッグデータ分析と人工知能:技術コンテンツの価値分析

[[265480]]テクノロジーの継続的な発展に伴い、テクノロジーの種類はますます増えています。人々...

...

IT ライフ: 遺伝的アルゴリズムを使用してコンピューターに歌詩を書かせる

出会いは幻想的で、窓の外はまた夜明けだった。弦楽器の音とかすかな笑顔をいつも思い出すが、世の中に花が...

...

スタンフォード大学がトランスフォーマー代替モデルを訓練:1億7000万のパラメータ、バイアスを除去可能、制御可能、解釈可能

GPT に代表される大規模言語モデルは、これまでも、そしてこれからも、並外れた成果を達成し続けますが...

...

栄創同志、競争は発展を促進する。第1回「AIIAカップ」人工知能ツアー説明会が北京で開催

2月28日、中国人工知能産業発展連盟「AIIAカップ」人工知能ツアー報告会において、中国航天科技集団...

AIがバリアフリー時代へ:手話認識・翻訳の応用が意味するものとは?

人々の印象では、AIは「多数派」に属する技術カテゴリーであると私は信じています。いわゆる多数とは、第...

AIと5Gが次のイノベーションの波をどう推進するか

[[427625]]今後10年間で、人工知能はあらゆる産業を変えると予想されており、その変化のきっか...

人工知能は認知と表現のギャップを埋めている

人工知能により、認知能力は高いが表現能力が限られている人でも、自分の考えを表現したり、物語を創作した...

Dubbo 負荷分散戦略コンシステントハッシュ

この記事では、主にコンシステント ハッシュ アルゴリズムの原理とデータ スキューの問題について説明し...

IoTとAI: この強力な組み合わせの5つの興味深い応用

人工知能は現代世界のあらゆる分野を征服しつつあります。しかし、それらはすべて私たちにとって良いことな...

微分可能アーキテクチャ検索DARTSより10倍高速な、Fourth Paradigmが最適化されたNASアルゴリズムを提案

ニューラル アーキテクチャ検索は、常に高い計算能力の代表例と考えられてきました。微分可能アーキテクチ...

大国間の競争の焦点:人工知能とデジタル主権

​​報告書は、経済の分離と地政学的な二極化が進む時代に、優れたデジタルまたはスマートなパートナーシッ...