8月2日、OpenAIは昨年4月に第2世代DALL-E「Vincent Image」モデルを発売した。このモデルは、その強力な実力で業界で広く注目を集め、一時期人気を博した。 海外メディアDecoderによると、OpenAIは次世代DALL-E AIモデル(DALL-E 3)を準備中とのこと。同社は現在一連のアルファテストを実施しており、一部のユーザーは既にAIモデルへの早期アクセスを行っている。 海外メディアによると、Discord上の匿名ユーザーが最近、DALL-E 3をテストした際の体験を共有したという。 匿名のユーザーは、5月のDALL-E 3テストバージョンでは、さまざまなアスペクト比の画像を生成でき、より長いプロンプト文をサポートし、「通常のテキスト」を生成できたと述べた。 ▲ 画像出典:デコーダー 今年7月のテスト版はさらに強力になっています。しかし、匿名のユーザーによると、 7月のテスト版では、一連のNSFWシーンや著作権で保護された商標パターンがランダムに生成される可能性があるとのことです。OpenAIは、モデルレベルからこのような「不適切なコンテンツ」の生成を禁止したいと考えているため、DALL-E 3には関連するトレーニング調整にまだしばらく時間が必要です。 海外メディアは、DALL-E 3は画質と多様性において飛躍的な進歩を遂げており、AIによる画像生成を新たな段階に押し上げると期待されていると報じた。 IT Homeは以前、Stable Diffusion XLが正式版1.0をリリースしたと報じた。Stability AIは、Stable Diffusion XL 1.0は同社がこれまで開発した「最も先進的な」AIツールであり、実際の効果は実に顕著であるため、OpenAIのDALL-Eモデルもこれに「真っ向から挑戦」することになると主張している。 |
>>: ソフトウェアと自動化機器が持続可能性と回復力を向上させる方法
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
最近、ディープラーニング分野の著名な研究者であり、Lightning AI のチーフ人工知能教育者で...
大規模言語モデル (LLM) には、デコーダーのみの構造 (GPT や LLAMA シリーズ モデル...
音声認識とは、機械またはプログラムが話し言葉の単語やフレーズを認識し、機械が読み取り可能な形式に変換...
ベンチャーキャピタル投資に関する最新データが示すところによれば、投資家は人工知能や機械学習のスタート...
最も注目されているテクノロジー企業OpenAIと世界一の富豪マスク氏との壮大な戦いは新たなレベルに達...
AI時代の生活にプライバシーは存在しません。スマート音声アシスタントはプライバシー漏洩の次の大きな災...
Baiduの最新アルゴリズム調整対応戦略、4つの対策でBaiduの最新アルゴリズム調整に対応します。...
[[415649]]最近、米国防総省は、大量の情報源を分析し、数日後の敵の行動を1分以内に予測し、事...
10月13日、The Informationは現地時間12日、複数の関係者の話として、OpenAI...
経営幹部は長い間、より高度な意思決定にデータ分析を使用することに抵抗し、AI 支援による意思決定より...
負荷分散の開発基盤は負荷分散アルゴリズムです。次に、サーバーごとに持つ機能や必要な機能が異なるため、...