Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える――

Google の研究者である Omer Bar-Tal 氏が Pika の創設科学者を務めています。

1か月前、Googleの共同執筆者としてビデオ生成モデルLumiereをリリースしたのですが、その効果は驚くべきものでした。

当時、ネットユーザーたちはこう言っていた。「Google がビデオ世代の戦いに参戦し、また素晴らしい番組が見られるようになるだろう。」

Stability AIのCEOや元Googleの同僚など、業界関係者の一部は祝福の言葉を送った。


ルミエール、修士号を取得したばかり

オメル・バータルは2021年にテルアビブ大学の数学・コンピュータサイエンス学部を卒業し、その後ワイツマン科学研究所に進学してコンピュータサイエンスの修士号を取得し、画像とビデオの合成分野の研究に重点を置きました。

彼の論文結果は、Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)など、トップカンファレンスで何度も採択されています。

彼らはTokenFlowを例に、トレーニングや微調整なしでビデオ編集タスクをサポートする拡散モデルに基づいたテキスト駆動型のビデオ編集を実装するためのフレームワークを提案しました。

Pika に入社する前は、Google Research で学生研究者として 9 か月間勤務し、7 か月間の研究を経て、ついに共同筆頭著者としてLumiereを立ち上げました。この時点では修士号はまだ取得していないはずです。

Lumiere の革新性は、提案された時空間 U-Net (STU-Net) アーキテクチャにあります。ビデオは空間次元と時間次元の両方で同時にダウンサンプリングおよびアップサンプリングされ、ネットワークの中間層でビデオの圧縮された時空間表現が得られます。

Lumiere は 3,000 万本のビデオから学習し、ビデオ生成、ビデオ編集と修復、画像からビデオへの変換、ビデオのスタイル設定など、複数の機能をサポートできます。

当時、ジェフ・ディーンは「マルチモーダルビデオ生成革命が起こっている」と称賛しました。

ウィル・スミスが麺を食べる(ピカバージョン)

ピカへの参加が正式に発表されると、関係者や投資家からも祝福の声が上がった。

数日前、ピカの Yilun Du という中国人研究者が論文を発表しました。しかし、彼はちょうど MIT で博士号を取得したばかり(あるいはまだ卒業していない)のはずで、論文の単位は依然として MIT のままです。

なお、公式サイトでは引き続き募集中です。


<<:  制御核融合における新たなマイルストーン! AIがプラズマの裂け目を予測することに成功し、ネイチャー誌に掲載され、クリーンエネルギーの「聖杯」に一歩近づいた。

>>:  GPT-4 が人間のデータ専門家を引き継いでいます!事前の知識により、LLMは従来の方法に匹敵する精度で大胆な予測を行うことができます。

ブログ    
ブログ    
ブログ    

推薦する

OpenAI のセキュリティ脆弱性が明らかに: ChatGPT の制限は一般的でない言語を使用することで簡単に回避可能

10月12日、ブラウン大学のコンピューターサイエンス研究者は、OpenAIのGPT-4セキュリティ設...

...

本当に知っておくべき 10 の AI テクノロジートレンド

人工知能技術のトレンドは人類を前進させています。デジタル変革はあらゆる業界に広がり、人工知能は科学者...

...

CVとNLPにおける対照学習の研究の進展

[[423166]]対照学習(CV)比較学習は何をするのでしょうか?教師ありトレーニングの典型的な問...

2021年9月のドローン業界の最新動向を3分で振り返る

現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の軌道に乗っています。...

企業がビッグデータの可能性を最大限に引き出す方法

専門家は、2025 年までにデータ ユニバース、つまりデータ ユニバースの規模が 180 ゼタバイト...

App Store 中国、検索アルゴリズムを最適化:名前による検索を復活

約1週間の不安が去った後、国内のiOSアプリ開発者はようやく落ち着くことができた。中国におけるApp...

北京冬季オリンピックまでのカウントダウン:人工知能は準備完了!あなたも?

「一つの夢」から「共に未来へ」へ2つのオリンピック開催都市、北京オリンピック聖火は今冬も歓迎される...

面接でコンシステントハッシュアルゴリズムについて再度質問されました。この答えは面接官を即死させるでしょう!

[[284994]]データシャーディングまずは例を見てみましょう。多くの場合、キャッシュには Re...

マイクロソフト、学習者の読解力向上を支援する独立AIツール「リーディングコーチ」を発表

IT Homeは1月19日、マイクロソフトが最近、学生向けの新しい生成AIツール「Reading C...

すごい...正義のために親族を殺す? Google AI、米国の月面着陸写真は偽物だと判定

1969年、アポロ11号が月面着陸に成功し、アームストロング船長は、今日でも数え切れないほどの人々が...

従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

Amazonが2006年にEC2サービスをリリースしてから11年が経ちました。この 11 年間で、A...

ファーウェイの孫茂陸氏:今後5年間で10億ドルを投資し、スマートエンタープライズサービスを構築する

上海で開催されたHUAWEI CONNECT 2019で、ファーウェイはエンタープライズサービス開発...

LLM の 3 つの大きな欠点のうちどれをご存知ですか?

科学: 未来の知覚を持つ汎用 AI は、永遠に慈悲深い存在とはほど遠く、個人データをすべて貪り尽くし...