今日、DALL·E 3 のチュートリアルがオンラインで話題となり、1 日も経たないうちに 100 万回近くも視聴されました。 このチュートリアルでは、DALL·E 3 を使用して画像を生成した後、ChatGPT を使用して画像の詳細を直接変更する方法をユーザーに説明します。 新しい要素の追加、色の変更などをすべて直接行うことができます。 DALL·E 3= Midjourney+Photoshop、確認済み! 写真 上の写真のように、生成された写真の 1 つにオウムが直接追加されます。 ステップ 1: 最初の画像を生成する 必要なプロンプトに基づいて画像を生成することから始めます。 例: 「青いパーカーを着た子供がカメラを見つめています。」 ヒント: ユーザーは、16:9 / 9:16 を追加することで、水平または垂直の画像の生成を制御することもできます。 写真 2 番目のステップは、イメージ シードを要求することです。各イメージには、「シード」と呼ばれる一意の識別子があります。 変更したい画像のシードを ChatGPT に問い合わせてください。たとえば、最初の画像の場合、プロンプトは次のようになります: 「画像 1 のシードは何ですか?」 このシードを取得したら、イメージの変更に進むことができます。 写真 ステップ 3. 画像を変更する このプロンプトを使用して、選択した画像を変更します: 「シード [1470033597] を使用して画像 [1] を変更します: 肩にオウムを追加します」 DALL·E 3は画像を認識して変更することができます! ヒント: - 必要なだけバリエーションを生成できます。 - 同じ方法を使用して、画像から要素を削除することもできます。 - 画像は 100% 同一ではない場合もありますが、少なくとも類似したものになります。 写真 さらに、一部のネットユーザーは、画像を右クリックして画像リンク/URLをコピーすることでシードを取得できると指摘しました。 シードは「se=」と「&」の間の内容です。 写真 また、ネットユーザーは、4日前にDALL・E 3のシードがすべて5000だったことに気づいたと指摘し、この異なるシード機能は最近更新されるはずだったと述べた。 著者は後に、自身の観察によれば、このシード関連の更新は過去 48 時間以内に完了しているはずだったと指摘しました。 写真 一部のネットユーザーからは、このシード関連の機能は「アカウントによるプッシュ」に属する他の機能と同じであるべきだとの指摘もあった。まだ使えない方は、静かにお待ちください。 写真 OpenAIは「黙々と努力」しており、偶然に「皆を驚かせる」ことを望んでいるようだ。 ネットユーザー効果表示以下は、ネットユーザーがこの技術を使用して独自に作成した画像を修正した場合の効果のデモンストレーションです。 写真 ネットユーザーが種を入手し、子供の肩に小さなハスキーを追加しました。とてもかわいいです。 写真 このネットユーザーは、自分が作成した画像内のキャラクターの表情を変えました。 写真 このネットユーザーは自分が生成した画像の視点を変えましたが、内容は非常に一貫していました。 この技術を Gen-2 などの画像生成ビデオ用の AI ツールと組み合わせることで、安定した映画編集効果を開発できるのではないかと考えました。 参考: https://twitter.com/itsPaulAi/status/1717197004651044914 |
>>: GPT-4 スーパーデラックスパッケージがオンラインに、新型 32K モデルがリーク!ファイルアップロード分析、自動モデル選択、そして何千ものAI企業の中で究極のキラー
マクリダキス M-コンペティション シリーズ (M4 および M5 と呼ばれます) は、それぞれ 2...
[[320126]] [51CTO.com クイック翻訳]ソフトウェア定義広域ネットワーク (SD-...
【CNMOニュース】最近、百度の創業者で会長兼CEOのロビン・リー氏はインド工科大学マドラス校が開...
「今夜の予定は全部キャンセル!」多くのAI開発者は寝ないことを決意しました。最初のオープンソース M...
[[266129]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
私たちは多くの驚くべき進歩を目撃しました。最新の AI 技術は、数千億の計算能力を瞬時に活用すること...
モノのインターネットの世界は手の届くところにありますが、それには良い面と悪い面の両方が伴います。機械...
毎年恒例のテクノロジー業界のオープニングショー「CES」が現在、米国ラスベガスで開催されています。 ...
[[347640]] Facebookはまた失敗したのか?フェイスブックは昨日、自社の機械翻訳が画期...
[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使...
GPT-4 の視覚機能がテスト用に完全にリリースされる前に、オープンソースのライバルが華々しくデビ...
大型模型の「堀」が再び破られた。謎のコードを入力することで、ビッグモデルは有害なコンテンツを生成する...
クラウドの優れた機械学習サービスを使用すると、ユーザーはデータをより適切に分析し、新たな洞察を得るこ...
現在、顔認識の応用はますます深く広範囲になり、それが引き起こす論争もますます激しくなっています。まず...