この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 椅子に座っているかわいい犬をフォトショップで猫に加工するには、何ステップ必要ですか? 最初のステップは犬の周りを回ることです。 2 番目のステップは、AI に必要なことを伝えることです。マウスをクリックするだけで完了です。 この AI 写真編集マスターは、実は古くからの友人であるDALL E.で、OpenAI で世界中に有名になった人物です。 現在は「2.0 超進化」が完成しました。写真編集の新しい素晴らしいスキルを習得しただけでなく、作品の質も飛躍的に向上しました。 では早速作品を見て感じてみましょう〜 これは、DALL·E 2 が「星雲爆発のコーギーの頭」というプロンプトで作成した絵画です。 このサルバドール・ダリの肖像画には、少しサルバドール・ダリの雰囲気が漂っていませんか? 初代DALL・Eに比べ、画質、芸術性ともに大幅に向上しました。 △「日の出の野原に座るキツネ、モネ風」 それで、研究者たちはどのようにしてDALL·Eの新しい能力を解き放ったのでしょうか? CLIP+ 拡散モデル簡単に言えば、DALL·E のこの進化は、より高い解像度とより低いレイテンシーを意味します。 さらに、次の 2 つの新機能が更新されました。 まず、テキスト→画像機能をより細かい粒度で実装します。 つまり、DALL·E 2 は自然言語プロンプトに基づいて写真編集を実行できます。写真編集の過程では、影、反射、テクスチャなどの要素の変化も考慮されます。 例えば、左の「2」アイコンの位置にフラミンゴの水泳用リングを追加すると、水面の反射などの細部もDALL-E2が処理します。 第二に、原作の核となる要素を保持しながら、原作に新しいスタイルを与えることが可能です。 また、生成される画像の品質はDALL·E 1の4倍、つまり256×256から1024×1024に向上しています。 CLIP は、オリジナルの DALL·E 機能実装の基盤です。画像の並べ替えを担当するモデルです。そのゼロショット学習能力は、さまざまな視覚および言語タスクで効果を発揮しています。 拡散モデルの特徴は、多様性を犠牲にして、生成される画像のリアリティを大幅に向上できることです。 そこで、OpenAI の研究者たちは次のような解決策を設計しました。 unCLIPと呼ばれるこのアーキテクチャでは、CLIP テキスト埋め込みは、画像埋め込みを生成する前に、まず自己回帰または拡散に送られます。 この埋め込みは、拡散エンコーダを調整して最終画像を生成するために使用されます。 OpenAIは、DALL Eは画像と画像の説明に使われるテキストとの関係を取得できると説明した。画像は「拡散」プロセスで生成されます。これは、「多数の点」から始まり、画像をどんどん詳細に埋めていくプロセスとして理解できます。 研究者らは、DALL·E 2 を DALL·E や GLIDE などのモデルと比較しました。 実験結果によると、DALL·E 2 の画像生成品質は GLIDE と同等ですが、DALL·E の生成結果はより多様です。 現在、DALL・E 2は一般公開されていませんが、ご興味のある方はオンラインで登録してお申し込みいただけます〜 プロジェクトアドレス: https://openai.com/dall-e-2/#デモ |
>>: 誇大広告か、効率か?サイバーセキュリティにおける人工知能の実用的応用
人工知能は教育分野に大きな波を起こしている。この傾向は、北京師範大学とiFLYTEKが共催した「人工...
スタンフォード大学は3月3日、2021年人工知能指数レポートを発表しました。その中で、AI関連の学習...
科学技術の進歩と社会の発展に伴い、ロボット産業は繁栄の時代を迎えています。ロボット工学は、コンピュー...
[[322852]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
[[201075]]ユーザー ポートレートの概念は非常に人気があります。多くの企業が「ユーザー ポー...
X プラットフォーム (Twitter) で AI 論文をよく閲覧する研究者は、AK (@_akha...
ジョークを一つ言わせてください。今、路上で物乞いをしている人を見かけたら、ぎこちなくポケットを触り、...
[[434282]] NVIDIA の秋の GTC カンファレンスが正式に開幕しました。 NVIDI...
[51CTO.com からのオリジナル記事] 現在の電子商取引業界は比較的成熟しており、さまざまな形...
機械学習はよく話題になりますが、「機械の忘却」について聞いたことがありますか?機械学習の目的は誰もが...
人工知能といえば、最先端のクールなアプリケーションのほかに、この話題になると「偽物」という言葉が思い...
転載は歓迎しますが、署名し、「劉鵬の未来を見つめる」公開アカウントからの転載であることを明記し、この...
11月8日、烏鎮で開催された世界インターネット大会で、馬化騰氏と李ロビン氏が首脳対談を行った。2人の...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
従来のクライアント監視および分析シナリオでは、特定の URL に基づく統計分析方法が使用されます。た...