Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える――

Google の研究者である Omer Bar-Tal 氏が Pika の創設科学者を務めています。

1か月前、Googleの共同執筆者としてビデオ生成モデルLumiereをリリースしたのですが、その効果は驚くべきものでした。

当時、ネットユーザーたちはこう言っていた。「Google がビデオ世代の戦いに参戦し、また素晴らしい番組が見られるようになるだろう。」

Stability AIのCEOや元Googleの同僚など、業界関係者の一部は祝福の言葉を送った。


ルミエール、修士号を取得したばかり

オメル・バータルは2021年にテルアビブ大学の数学・コンピュータサイエンス学部を卒業し、その後ワイツマン科学研究所に進学してコンピュータサイエンスの修士号を取得し、画像とビデオの合成分野の研究に重点を置きました。

彼の論文結果は、Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)など、トップカンファレンスで何度も採択されています。

彼らはTokenFlowを例に、トレーニングや微調整なしでビデオ編集タスクをサポートする拡散モデルに基づいたテキスト駆動型のビデオ編集を実装するためのフレームワークを提案しました。

Pika に入社する前は、Google Research で学生研究者として 9 か月間勤務し、7 か月間の研究を経て、ついに共同筆頭著者としてLumiereを立ち上げました。この時点では修士号はまだ取得していないはずです。

Lumiere の革新性は、提案された時空間 U-Net (STU-Net) アーキテクチャにあります。ビデオは空間次元と時間次元の両方で同時にダウンサンプリングおよびアップサンプリングされ、ネットワークの中間層でビデオの圧縮された時空間表現が得られます。

Lumiere は 3,000 万本のビデオから学習し、ビデオ生成、ビデオ編集と修復、画像からビデオへの変換、ビデオのスタイル設定など、複数の機能をサポートできます。

当時、ジェフ・ディーンは「マルチモーダルビデオ生成革命が起こっている」と称賛しました。

ウィル・スミスが麺を食べる(ピカバージョン)

ピカへの参加が正式に発表されると、関係者や投資家からも祝福の声が上がった。

数日前、ピカの Yilun Du という中国人研究者が論文を発表しました。しかし、彼はちょうど MIT で博士号を取得したばかり(あるいはまだ卒業していない)のはずで、論文の単位は依然として MIT のままです。

なお、公式サイトでは引き続き募集中です。


<<:  制御核融合における新たなマイルストーン! AIがプラズマの裂け目を予測することに成功し、ネイチャー誌に掲載され、クリーンエネルギーの「聖杯」に一歩近づいた。

>>:  GPT-4 が人間のデータ専門家を引き継いでいます!事前の知識により、LLMは従来の方法に匹敵する精度で大胆な予測を行うことができます。

ブログ    
ブログ    

推薦する

Qualcomm CVPR 研究: ビデオ処理の計算を 78% 削減、畳み込み層に「ピクセルの選択」を教える

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能技術はスマートシティの未来となるのでしょうか?

人工知能技術の急速な発展は、私たちの日常生活のあらゆる側面に変革的な影響を及ぼしています。 最も注目...

マイクロソフトとヤフーが検索広告契約を締結、Bingがヤフーの独占アルゴリズムに

7月29日、これまでの多くの噂がついに確認された。マイクロソフトとヤフーは10年間の検索協力契約を締...

AIで生成された出版物の急増により、Amazonは書籍の著者に作品でのAIの使用をプラットフォームに通知することを義務付けている。

9月10日、AP通信は、全米作家組合やその他の団体から何か月にもわたる苦情を受けて、アマゾンのファ...

...

エッジ AI ソフトウェア市場は 2023 年までに 11 億 5,000 万ドルに達する見込み

市場調査会社MarketsandMarketsによると、世界のエッジ人工知能(エッジAI)ソフトウェ...

複数の機械学習モデルインスタンスを素早く比較する

導入機械学習プロジェクトに取り組むとき、すべてのデータ サイエンティストが直面しなければならない質問...

...

デジタル産業を支援し、インテリジェントな未来をつなぐ――西安航空基地企業「ファーウェイ参入」デジタル変革社長クラス

[51CTO.comからのオリジナル記事]現在、疫病と政治環境の影響により、多くの不確定要素が重なり...

「トランスフォーマー チャレンジャー」マンバはMacBookでも動く! GitHub は半日で 500 以上のスターを獲得しました

「トランスフォーマーの挑戦者」MambaがMacBookで実行できるようになりました!誰かが Git...

変化が起こっています!機械学習は人類をどこへ導くのでしょうか?

[[187530]]人工知能 (AI) がどのように未来を予測し、職場を変え、さらには雇用を生み出...

「中国の新世代人工知能開発報告書2020」:中国はよりオープンな姿勢で人工知能の発展を推進

「中国の新世代人工知能開発報告書2020」(中国語版と英語版)が本日、浦江イノベーションフォーラムで...

Amazon AIテクノロジーの応用と戦略的なレイアウトの詳細な分析:Alexa

アマゾンは時価総額7,900億ドルでマイクロソフトを上回り、世界で最も価値のある企業となった。ジェフ...

IoTとAIが出会うとき: テクノロジーの未来

人工知能(AI)は驚異的な進歩を遂げ、一般に応用可能な技術として社会に影響を与えています。しかし、初...