OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

海外メディアの報道によると、OpenAIは2月18日、短いテキストプロンプトを通じて「リアル」かつ「想像力豊かな」60秒の動画を作成できると言われるSoraという新しいAIモデルを発表した。

OpenAIはブログ投稿で、Soraはテキスト指示に基づいて最長60秒の動画を生成でき、複数のキャラクター、特定の種類のアクション、詳細な背景の詳細​​を含むシーンを思いつくことができると述べた。

「このモデルは、ユーザーがプロンプトで何を求めているのかを理解するだけでなく、それが現実世界にどのように存在するのかも理解します」とブログ投稿には書かれている。

OpenAIは、AIモデルを訓練して「現実世界でのやり取りを必要とする問題を人々が解決できるように」する計画だと述べた。

市場調査会社ABIリサーチのシニアアナリスト、リース・ヘイデン氏は、「マルチモーダルモデル」は新しいものではなく、テキストから動画へのモデルはすでに存在しているが、OpenAIが主張するSoraの長さと正確さは、Soraをユニークなものにしていると述べた。

ヘイデン氏は、新しいパーソナライズされたコンテンツがさまざまなチャネルを通じて配信されるようになるため、こうしたタイプの AI モデルはデジタル エンターテイメント市場に大きな影響を与える可能性があると述べました。

「明らかな使用例はテレビで、物語を補足する短いシーンを作成するものです」とヘイデン氏は言う。「このモデルにはまだ限界がありますが、市場がどこに向かっているかを示しています。」

同時に、OpenAIは、Soraはまだ開発中であり、特に手がかりの空間的詳細に関して重大な「弱点」があると述べた。例えば、クッキーを一口食べたものの、食べた後には噛み跡が残っていないという動画が作られました。

今のところ、OpenAI のメッセージは安全性に重点を置いています。同社は、専門家チームと協力して最新モデルをテストし、誤報、憎悪的なコンテンツ、偏見などの分野を注意深く監視する予定だと述べた。同社は、誤解を招く情報の検出に役立つツールも開発中だと述べた。

Sora は、まず、製品の危害やリスクを評価する「レッドチーム」と呼ばれるサイバーセキュリティの教授たちに提供される予定です。また、多くのビジュアルアーティスト、デザイナー、映画製作者にアクセスを提供し、クリエイティブプロフェッショナルがどのように使用しているのかについてのフィードバックを収集しています。

<<:  Appleは開発者がアプリのコードを書くのに役立つXcodeのアップデート版を開発中だ

>>:  OpenAIのSora、中国は追いつけないのか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

脚本を書いて、AIが動画を自動編集:編集者の7時間かけて作成した動画を13分で完成

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人間は強力な人工知能の開発を心配する必要はない

[51CTO.com クイック翻訳] 現在、人工知能技術が「悪のロボット」に発展し、世界を支配するの...

...

正確な画像認識を望むなら、AIデータの精度を効果的に向上させることが鍵となる

技術の継続的な反復的発展により、人工知能の応用は人々の日常生活に巧妙に浸透してきました。インテリジェ...

ジェネレーティブAIはCIOにとって成否を分ける瞬間

IT リーダーは、まずユースケースに合わせて戦略を最適化し、次世代 AI の可能性と落とし穴を実用的...

Google と OpenAI の新しい研究: ダーウィンの進化論を人工知能アルゴリズムの設計にどのように活用するか?

現代の機械知能は自然を模倣することに基づいています。この分野の主な目標は、人間が生物学的に持つ強力な...

...

液体ロボットはマーケティングの策略か、それとも自動化の未来か?

液体ロボットのコンセプトは、ロボット工学と自動化をいくつかの点で変えることが期待されています。その ...

デジタル時代において、クラウドインテリジェンスはクラウドの未来を再定義します

[51CTO.comからのオリジナル記事] デジタル時代において、人工知能の普及はクラウドコンピュー...

機械学習がインドのヘルスケア分野に変化をもたらす

ヘルスケア産業はインド経済において最大のセクターの一つとなっている。 NITIAyogの報告によると...

新しい形の人工知能が登場: AIaaSについてお話しましょう

「サービスとしての」配信モデルの誕生以来、SaaS と PaaS は日常的な技術用語の一部となり、企...

...

...

NeRFは線画に基づいてリアルな3D顔を生成し、詳細とスタイルを自由に変更できる。この論文はSIGGRAPHに提出されている。

非常にリアルで正確に制御可能な 3 次元の顔のモデリングは、デジタル ヒューマン構築における重要な課...

製造業者はデジタルツインをどのように活用して生産性を向上できるでしょうか?

メーカーは、競争上の優位性を獲得し、コストを削減し、顧客によりカスタマイズされた体験を提供するために...