Google 独自の「DALL-E/Midjourney」がついにオンラインになりました。 本日、Google は検索エンジンに大きなアップデートを行いました。 検索ボックスにプロンプトワードを入力するだけで、画像の生成が直接開始されます。 ユーザーにとって、この新機能は「学習コスト」を追加せず、通常どおり検索を開くことができます。 デフォルトの結果は 4 枚の写真で、検索インターフェースの上部に表示されます。クリックすると jpg 形式でダウンロードされます。 満足できない場合はプロンプトワードを使ってさらに編集できるのでとても便利です。 さらに、画像検索機能にもちょっとしたサプライズがあります。 マウスを何回もスクロールしても、希望する結果が見つからなかったことはありませんか? 問題ありません。私たち自身でいくつか「新しい」ものを作ることができます。 (「新しいものを作成」という白いボックスをクリックすると、これを実行できます。下の画像は、「ミニマリスト ハロウィーン デスクトップ レイアウト」を検索したものです) 詳細を見てみましょう〜 Google版「DALL-E/Midjourney」はこちら上記の画像生成機能は、Google 独自の Wensheng グラフ モデルを活用しています。 画像. この作品は、昨年5月に公開されたが、これは「ネットワーク全体に衝撃を与えた」DALL・E 2の公開からわずか1か月後のことだった。 Imagen 言語モデル部分は Google 独自の T5-XXL を使用しており、テキスト エンコーダーはトレーニング後にフリーズされます。 画像生成部分は一連の拡散モデルであり、最初に低解像度の画像を生成し、次に段階的にスーパーサンプリングします。 最終的な効果は、リアリズムと高忠実度に重点を置いた DALL·E 2 よりもさらに優れています。 現在、Google 検索に統合された後、Google が Imagen 向けに生成したすべての画像には、 「これは AI によって生成されたものです」というメタデータ識別子が埋め込まれ、目に見えない透かしが追加されます。 この操作は、Google Cloud と DeepMind が今年 8 月にリリースした SynthID テクノロジーによってサポートされています。 この技術は画像の品質に影響を与えず、フィルターの追加、色の変更、さまざまな非可逆圧縮を使用した保存などの変更を行った後でも透かしを検出可能なままにすることができます。 この新機能について、Google は責任を非常に真剣に受け止めています。 これを使用して作品を生成すると、かなり厳しいフィルタリングとレビューを受けることになります。 最も基本的なわいせつな内容や有害内容の禁止に加え、実名の入力や実在の人物の画像の作成も禁止されています。 ご利用には18歳以上である必要があります。 制限もあります: Google は今年 5 月の I/O カンファレンスで検索の再構築と AI 対話などの機能の導入を発表したが、同社は「まだ完璧ではない」ため、完全に安心できていない。 検索 AI 機能全体は「Google Search Labs」で公開されており、使用するには事前に申請する必要があります。 さらに、当初はさまざまな新しい AI 検索機能が米国でのみ利用可能でしたが、最近になってインドと日本にも拡大されました。 明日より、このAI画像生成機能は申請を承認したユーザーのみにプッシュされます。 そのため、最初に体験できる人は多くありません。 そしてこの観点から見ると、マイクロソフトのような企業と比較すると、Google は自社製品の AI の進歩が確かに遅いと言えます。 ライティングアシスタントもアップデートされました検索における新しい AI 画像生成に加えて、もう 1 つのアップデートがあります。 ライティングアシスタント。 Google が想定しているシナリオは、ユーザーが Google を使用して装飾やガレージの改造などのコンテンツを検索し、請負業者や企業を検索するというものです。ライティング アシスタントを使用すると、AI が企業に見積もりを依頼するメールの作成などを手伝ってくれます。 現在、アシスタントはより多くの種類のテキストを出力できます。 長さは長いか短いか、口調は真面目かカジュアルか。 最終的なドキュメントについては、もちろん、Google メールや Google ドキュメントなどの Google Workspace アプリケーションにエクスポートして処理することもできます。 |
>>: 「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった
最近はロボットが家事のすべてを担うようになりました。ポットを使えるスタンフォードのロボットが登場した...
1. 要件の説明文字列を入力し、文字列内の単語を逆順に組み立てて出力するプログラムを作成します。たと...
[[344168]] 2019年8月、科学技術部は「国家新世代人工知能イノベーション開発パイロットゾ...
Mobile World Congress 2024 で AI について言及しないわけにはいきません...
Audi A8L を運転しているとき、簡単な言葉を発するだけで、旅に必要なものがすべて手に入ると想像...
10月24日、DeePhi Technologyの2017年新製品発表会が北京の朗園にあるVinta...
01 ハイテク時代の失業ゼロ半世紀以上前、有名な数学者ジョン・フォン・ノイマンは、機械を製造するコ...
音声テキスト変換(STT)システムは、話した言葉をテキストに変換できる方法です。私たちがよく使うWe...
この共有のテーマは、「OpenLLM を使用して大規模な言語モデル アプリケーションを迅速に構築およ...
いつか、おそらく数十年以内に、人工ニューラル ネットワークを使用して、人間の脳をリアルにシミュレート...