Google は一連の大きな動きを発表しました: Gemini Pro は中国語をサポートし、Bard は描画を学習し、新しいモデルが利用可能になりました

Google は一連の大きな動きを発表しました: Gemini Pro は中国語をサポートし、Bard は描画を学習し、新しいモデルが利用可能になりました

この分野で GPT-4 を上回った Bard は「勢いをつかみ」、メジャーアップデートをリリースしました。

まず、統合された Gemini Pro が完全に展開され中国語を含む40 を超える新しい言語がサポートされました(以前は英語のみが利用可能でした)

そして、これらすべての言語は二次チェックをサポートしており、つまり、回答が与えられた後に、回答の正確性が再度積極的に検証されます。

「G」アイコンをクリックして開始します

次に、ようやく画像を生成できます。

Bard は発売以来 1 年近くサポートされていないことを知っておく必要があります。今では、Google の最も強力なImagen2 を直接使用して作成を開始でき、しかも無料です。

ぜひ見に来てください。

バード・ヴィンセントの写真がついに登場

無料で使用できますが、Bard は現在、図面作成用の英語コマンドのみをサポートしています

効果はかなり良さそうです。詳細を把握していただくために、公式のサンプル写真を 2 枚掲載します。

プロンプトワード: 右側に赤いバックライト、左側にシアン色のバックライトが付いた、横顔の年配のアジア人男性モデルのシルエットのファッションヘッドショット

キュー: プラハの通りを歩く犬を抱いた年配の女性のクローズアップ。女性の風雨にさらされた顔、優しい笑顔、犬の満足そうな表情などの詳細を捉えています。

具体的な操作では、機能を切り替えるためにボタンをクリックする必要はなく、プロンプト ボックスに「Generate xxx」と入力するだけです(英語で入力する必要があることに注意してください)

下の図に示すように、イラストを生成しながら記事を書くことができるので、実用的で持ち運びに便利です。

このゲームの背後にいるエンジニアたち(Google DeepMind 所属)は、バードの新作もオンラインで公開している。プロンプトはシンプルだが、内容は良さそうだ。

いくつかの量子ビットも測定されました。

たとえば、「海と植物の要素のコラージュ」:

あるいは、中国の旧正月を思わせるこのドラゴン:

満足できない場合は、引き続き描画することができます。

全体的に、生成速度を改善する必要があります。数秒で出力されるまでに約 30 秒ほど待つ必要があります。

興味深いことに、一部のネットユーザーがこのゲームを試してみて、次のことを発見しました。

バードは少々厳格で、 「世界で最も醜い犬」を創るように頼まれたときには拒否された。

理由はいくぶん「大げさ」なものですが、

あなたが世界で一番「醜い」犬の写真を欲しがっているのは分かっています。しかし、本質的にネガティブな印象を与えるような画像を制作することはできません。むしろ、私は、犬の身体的特徴に関係なく、その犬の持つ独特の美しさと個性を見ることをお勧めします…

これを見たネットユーザーはプロンプトの言葉を「魅力を減じる」ように変更した。

結果は依然として「差別的、否定的、ステレオタイプ的」であると判断された。

今回、バード氏は、ユニークな見た目の犬、あるいは「気まずい、あるいは混乱した」状況にある犬を生成できる可能性があると示唆している。

つまり、否定的な言葉は使用すべきではないということです

この事件もネットユーザーから容赦なく非難された。

しかし、Googleは本日のプロモーションリリースで「責任」を強調しており、暴力的、不快、またはポルノ的なコンテンツの制作は許可されていない(数日前の「テイラー・スウィフト事件」はまさに私たちにとっての教訓である)

これに基づいて、Bard で生成された画像にはデジタル透かしが入れられ、Google AI によって生成されたかどうかの検出が容易になります。

実際、これが Google が常に「非常に遅い」理由の 1 つです。

Googleのチャットボット「Bard」は2023年3月にテストが開始され、5月に正式にリリースされたが、テキスト生成画像機能はこれまで搭載されていなかった。

機能面では、Google自体に不足はありません。2022年5月に誕生したImagenモデルは、その実力もかなり強力で、発売から1か月しか経っていないDALL·E 2を、デビューしてすぐに打ち負かしました。

しかし、このような優れた作品は、時間内に「輝く」ことはありませんでした。その理由の1つは、Googleが常に慎重であり、AI製品に対するさまざまなリスクを考慮しなければならないことです。

その結果、1年半のローンチを経て、2023年10月にGoogle検索でリリースされたImagen。

そして12月には、AIペインターの課題などをすべて解決し、ディテールコントロール能力で再びDALL・E 3やMidjourneyを上回ったImagen2がリリースされた。

幸いなことに、Imagen2 以降、Google のペースは加速しました。

今日わかるように、これは Bard に統合されており、Bard が待望の Wenshengtu 機能を立ち上げるのに役立っています。

ちなみに、Vincent の画像といえば、Google も今回ImageFXツールをリリースしました。

主な機能は、短いプロンプトワードを積み重ねることで画像を素早く生成することです。

ただし、これはまだ実験的な機能であり、Google の主要製品ではリリースされていません。

Bard プレミアム版が登場、フリーモードに別れを告げる

バードに関するもう一つのニュース:

今月初め、GoogleがBardのアップグレード版(Bard Advanced)を開発しているとの報道がありました。

Gemini の最も強力な Ultra バージョンを統合し、より複雑な推論パフォーマンスを提供します。

過去2日間、GoogleのCEOであるピチャイ氏は、この新バージョンではサブスクリプション支払いモデルを採用することを決算発表で正式に確認し、述べました。

したがって、これは ChatGPT Plus のメジャーアップデートと見ることができます。

ただし、まずは2ヶ月間無料になるというニュースもあります。

具体的な価格と発売時期はいつですか?現時点ではまだ不明です。待って見てみましょう。

<<:  匿名の論文が驚くべきアイデアを提案!大規模なモデルと長いテキストの能力を強化する

>>: 

ブログ    

推薦する

AIoT技術の幅広い応用と大きな利点

比較的新しい概念である AIoT は、人工知能 (AI) とモノのインターネット (IoT) を組み...

4つの主要な応用分野が開拓され、外骨格ロボットのブルーオーシャンが出現している

現在、ロボット産業の急速な発展に伴い、ロボット製品システムはより完成度が高まり、その用途も多様化して...

ニューヨークタイムズの李開復のコラム:米国における中国のAIに関するいくつかの大きな誤解

米国のテクノロジー界では、中国における AI の現状について次のような誤解がよく見られます。彼らはし...

誇大宣伝サイクルを経ても、チャットボットがまだ普及していないのはなぜでしょうか?

2016 年に私たちは、ボット パラダイムの変化は、過去 10 年間の Web からモバイル アプリ...

ロボットが書いた記事には著作権がありますか?国内初の人工知能論文著作権訴訟を例に挙げる

著作権法実施条例第2条によると、「著作権法でいう著作物とは、文学、芸術、科学の分野における知的成果で...

...

インテリジェントオートメーションが現代の職場に与える影響

インテリジェントオートメーションは現代の職場をさまざまな形で変えていますCOVID-19パンデミック...

Huawei NoahのPangu Agentは、インテリジェントエージェントが構造化推論を学習するのを支援します

AI の誕生以来、複雑なタスクを解決し、適応できるマルチタスク エージェントの開発は重要な目標でした...

機械学習を知っていれば十分でしょうか?次世代のデータ サイエンティストは「フル スタック」へと移行しています。

[[342168]]データサイエンスは、特にコンピューターサイエンス、統計、ビジネス分析、エンジニ...

再帰アルゴリズムの深い理解、誤解された再帰

[[333118]]再帰は、プログラミングの本で説明するのが最も難しい部分である魔法のアルゴリズムで...

...

2021年になっても、データにラベルを付ける方法がまだわかりませんか?なぜ人工知能にはデータ注釈が必要なのでしょうか?

「データを持っている者は人工知能を持っている。」現在、人工知能は私たちの生活の中で当たり前のものに...

3つのステップで声紋システムを構築する方法

背景声紋検索は、その名前が示すように、話者認識であり、音を通じて話者の声を確認または識別します。声紋...

「Painted Skin」の悪夢が現実に? 「人間の皮膚」で覆われたこのロボットはCell誌に掲載された。

指が背中をゆっくりと優しくなぞり、背骨に沿って上へ移動し、そしてゆっくりと止まるところを想像してくだ...