Googleがこれまでで最も強力なAIモデル「Gemini」を発表

Googleがこれまでで最も強力なAIモデル「Gemini」を発表

グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だと考える人工知能モデルを発表した。

大規模言語モデル Gemini には、最大かつ最も強力なカテゴリである Gemini Ultra、さまざまなタスクに拡張可能な Gemini Pro、特定のタスクやモバイル デバイスで使用される Gemini Nano の 3 つの異なるキットが含まれます。

同社は現在、Google Cloud を通じて顧客に Gemini のライセンスを供与し、顧客独自のアプリケーションで使用してもらうことを計画している。 12 月 13 日より、開発者および企業顧客は、Google AI Studio または Google Cloud Vertex AI の Gemini API を通じて Gemini Pro にアクセスできるようになります。 Android 開発者も Gemini Nano を使用してビルドできるようになります。 Gemini は、Bard チャットボットや、会話形式のテキストで検索クエリに回答する Search Generated Experience などの Google 製品にも使用される予定です (SGE はまだ広く利用可能ではありません)。

企業は、チャットボットや製品の推奨を通じてより高度な顧客サービスを提供したり、製品の宣伝を希望する企業のトレンドを特定したりするためにこれを使用できます。 Gemini は、企業がマーケティング キャンペーンやブログ コンテンツを作成したい場合のコンテンツ作成や、会議の要約や開発者向けのコード生成を行う生産性向上アプリにも使用できます。

同社は、ジェミニがグラフのスクリーンショットを撮り、何百ページもの研究レポートを分析してグラフを更新できることを示す例や、ある人の数学の宿題の写真を分析して正解を見つけ、間違った答えを指摘する例など、いくつかの例を示した。

ジェミニ・ウルトラは、数学、物理学、歴史、法律、医学、倫理学など57の科目を組み合わせて世界知識と問題解決能力をテストする大規模マルチタスク言語理解(MMLU)において人間の専門家を上回る成績を収めた初のモデルであると、同社は水曜日のブログ投稿で発表した。複雑な内容のニュアンスや論理的思考を理解できると言われています。

「ジェミニは、Google Researchの同僚を含むGoogle全体の大規模なコラボレーションの成果です」とGoogle CEOのサンダー・ピチャイ氏は水曜日のブログ投稿で述べた。「最初からマルチモーダルであり、テキスト、コード、音声、画像、動画など、さまざまな種類の情報を一般化し、シームレスに理解、操作、組み合わせることができることを意味します。」

本日より、Google のチャットボット Bard は、高度な推論、計画、理解、その他の機能を支援するために Gemini Pro を使用します。同社幹部は火曜日の記者との電話会議で、来年初めにジェミニ・ウルトラを採用した「バード・アドバンスト」を発売する予定だと語った。

このアップデートは、検索大手の Google が初めて Bard をリリースしてから 8 か月後、OpenAI が GPT-3.5 上で ChatGPT をリリースしてから 1 年後に行われました。 3月に、アルトマン氏が率いるスタートアップはGPT-4を立ち上げた。幹部らは火曜日、ジェミニ・プロはGPT-3.5よりも性能が優れていると述べたが、GPT-4と比べるとどうなのかという質問には答えなかった。

しかし、Googleが水曜日に発表したホワイトペーパーによると、GeminiのUltraモデルはいくつかのベンチマークでGPT-4を上回ったという。

Google が Bard Advanced へのアクセスを有料化する計画があるかどうか尋ねられたとき、Google Bard ゼネラルマネージャーの Sissie Hsiao 氏は、Google は優れたエクスペリエンスを生み出すことに注力しており、収益化に関する詳細はまだないと述べた。

記者会見で、現世代のLLMと比べてGeminiには何か新しい機能があるかと尋ねられたとき、Google DeepMindの製品担当副社長であるEli Collins氏は「あると思います」と答えたが、同社はまだGemini Ultraaの新しい機能の理解に取り組んでいるところだ。

Google は、準備が整っていないため Gemini のリリースを延期したと報じられており、今年初めに同社が AI ツールの展開に苦戦していたことを思い出すことになる。

複数の記者が遅延について質問したところ、コリンズ氏は、より高度なモデルのテストには時間がかかると答えた。コリンズ氏は、ジェミニは同社がこれまでに構築したAIモデルの中で最も厳密にテストされたものであり、グーグルのモデルの中で「最も包括的な安全性評価」を受けていると述べた。

ジェミニ・ウルトラは最大モデルであるにもかかわらず、メンテナンス費用がはるかに安いとコリンズ氏は言う。 「能力が高まっただけでなく、効率も向上しました」と同氏は言う。「ジェミニを訓練するにはまだ多くのコンピューターが必要ですが、これらのモデルを訓練する能力はより効率的になってきています。」

コリンズ氏は、同社がこのモデルについての詳細を記載した技術白書を水曜日に発表する予定だが、円周数は公表しないと述べた。今年初め、ジャーナリストたちは、当時最新だった Google の AI モデル「Palm 2 Large Language Model」が、その前身である LLM のほぼ 5 倍の量のテキスト データでトレーニングされていることを発見しました。

また、水曜日にGoogleはAIモデルのトレーニング用次世代Tensor Processing Unitを発表した。グーグルは、セールスフォースと新興企業のライトリックス社が、2021年に発表されたTPU v4よりも優れた価格性能比を提供するTPU v5pチップの使用を開始したと述べたが、市場リーダーのエヌビディアと比較したパフォーマンスに関する情報は提供しなかった。

10月に行われたグーグルの第3四半期の決算発表の際、投資家らは同社がAIをいかにして実際の利益につなげていくのかについて幹部らにさらなる質問をぶつけた。

Google は 8 月に Search Generative Experiences (SGE) と呼ばれる初期の実験を開始しました。これは、検索エンジンを使用する際に GenAI エクスペリエンスがどのようなものになるかをユーザーが確認できるようにするものです。検索は依然として同社の主要な収益源であり、結果はチャットボットの時代を反映してより会話形式になっていますが、まだ実験段階と考えられており、一般には公開されていません。

ジェミニが5月に年次開発者会議「Google I/O」で初めてこの実験を発表して以来、投資家らはSGEのタイムラインを尋ねてきた。ジェミニの水曜日の発表ではSGEについてほとんど触れられず、幹部らは一般公開の計画については曖昧で、「今後1年以内に」ジェミニはSGEに統合されると述べている。

「このモデリングの新時代は、当社がこれまで取り組んできた科学と工学の取り組みの中でも最大のものの一つです」とピチャイ氏は水曜日のブログ投稿で述べた。「ジェミニが世界中の人々にもたらすであろう未来と機会に、私は本当に興奮しています。」

<<:  Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

>>:  Gemini vs ChatGPT: Google の最新 AI と ChatGPT のどちらが優れているのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

...

...

AI愛好家が注目するべき8人のインスタグラマー

人工知能(AI)は現在、主要な技術進歩の一部となっています。そして、AI がますます強力かつ高度にな...

知能ロボット技術の応用と開発動向

王耀南院士が2020年国家ロボット開発フォーラムで報告著者プロフィール:王耀南、中国工程院院士、湖南...

2年半の訓練を経て、テスラのヒューマノイドロボット「オプティマス2」がオンラインになった。

何の前触れもなく、テスラのヒューマノイドロボット「オプティマス」の第2世代が登場しました。 12月1...

チャットボットにおける2つの技術的火種: AIと機械学習

チャットボットの人気が高まるにつれて、競合するアプリケーション フレームワークが多数登場しました。 ...

AES暗号化アルゴリズムの強度が弱まった

この脆弱性は、広範囲にわたる暗号分析を行った3つの大学とマイクロソフトの研究者によって発見されたが、...

Pythonを知らない人は、人工知能時代の新たな「文盲」になるだろう

各段階で、「文盲」の定義は異なります。以前は、漢字を知らないことが文盲とみなされ、後には、英語を話せ...

マイクロソフト、AIアシスタントCopilotを搭載したWindows 11のメジャーアップデートをリリース

11月1日(米国時間火曜日)、ソフトウェア大手マイクロソフトは、パソコン用OS「Windows 11...

AI STUDIO - AI機能を実現するためのハードルゼロ

AI技術の発展により、人類社会は熱い知能革命の真っ只中にあります。技術革命の波に素早く適応できる者が...

...

sklearnのトレーニング速度が100倍以上向上、米「Fanli.com」がsk-distフレームワークをオープンソース化

この記事では、Ibotta (「Rebate Network」の米国版) の機械学習およびデータ サ...

機械学習で不均衡なデータをどのように処理しますか?

上司から、利用可能なさまざまな測定値に基づいて製品に欠陥があるかどうかを予測するモデルを作成するよう...

人工知能が物流業界に革命を起こす5つの方法

人工知能は物流業界の変革において重要な役割を果たしていることが証明されています。グローバル化が加速す...

古典的な構造から改良された方法まで、ニューラルネットワーク言語モデルのレビュー

自然言語処理 (NLP) システムのコアコンポーネントとして、言語モデルは単語表現と単語シーケンスの...