Googleがこれまでで最も強力なAIモデル「Gemini」を発表

Googleがこれまでで最も強力なAIモデル「Gemini」を発表

グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だと考える人工知能モデルを発表した。

大規模言語モデル Gemini には、最大かつ最も強力なカテゴリである Gemini Ultra、さまざまなタスクに拡張可能な Gemini Pro、特定のタスクやモバイル デバイスで使用される Gemini Nano の 3 つの異なるキットが含まれます。

同社は現在、Google Cloud を通じて顧客に Gemini のライセンスを供与し、顧客独自のアプリケーションで使用してもらうことを計画している。 12 月 13 日より、開発者および企業顧客は、Google AI Studio または Google Cloud Vertex AI の Gemini API を通じて Gemini Pro にアクセスできるようになります。 Android 開発者も Gemini Nano を使用してビルドできるようになります。 Gemini は、Bard チャットボットや、会話形式のテキストで検索クエリに回答する Search Generated Experience などの Google 製品にも使用される予定です (SGE はまだ広く利用可能ではありません)。

企業は、チャットボットや製品の推奨を通じてより高度な顧客サービスを提供したり、製品の宣伝を希望する企業のトレンドを特定したりするためにこれを使用できます。 Gemini は、企業がマーケティング キャンペーンやブログ コンテンツを作成したい場合のコンテンツ作成や、会議の要約や開発者向けのコード生成を行う生産性向上アプリにも使用できます。

同社は、ジェミニがグラフのスクリーンショットを撮り、何百ページもの研究レポートを分析してグラフを更新できることを示す例や、ある人の数学の宿題の写真を分析して正解を見つけ、間違った答えを指摘する例など、いくつかの例を示した。

ジェミニ・ウルトラは、数学、物理学、歴史、法律、医学、倫理学など57の科目を組み合わせて世界知識と問題解決能力をテストする大規模マルチタスク言語理解(MMLU)において人間の専門家を上回る成績を収めた初のモデルであると、同社は水曜日のブログ投稿で発表した。複雑な内容のニュアンスや論理的思考を理解できると言われています。

「ジェミニは、Google Researchの同僚を含むGoogle全体の大規模なコラボレーションの成果です」とGoogle CEOのサンダー・ピチャイ氏は水曜日のブログ投稿で述べた。「最初からマルチモーダルであり、テキスト、コード、音声、画像、動画など、さまざまな種類の情報を一般化し、シームレスに理解、操作、組み合わせることができることを意味します。」

本日より、Google のチャットボット Bard は、高度な推論、計画、理解、その他の機能を支援するために Gemini Pro を使用します。同社幹部は火曜日の記者との電話会議で、来年初めにジェミニ・ウルトラを採用した「バード・アドバンスト」を発売する予定だと語った。

このアップデートは、検索大手の Google が初めて Bard をリリースしてから 8 か月後、OpenAI が GPT-3.5 上で ChatGPT をリリースしてから 1 年後に行われました。 3月に、アルトマン氏が率いるスタートアップはGPT-4を立ち上げた。幹部らは火曜日、ジェミニ・プロはGPT-3.5よりも性能が優れていると述べたが、GPT-4と比べるとどうなのかという質問には答えなかった。

しかし、Googleが水曜日に発表したホワイトペーパーによると、GeminiのUltraモデルはいくつかのベンチマークでGPT-4を上回ったという。

Google が Bard Advanced へのアクセスを有料化する計画があるかどうか尋ねられたとき、Google Bard ゼネラルマネージャーの Sissie Hsiao 氏は、Google は優れたエクスペリエンスを生み出すことに注力しており、収益化に関する詳細はまだないと述べた。

記者会見で、現世代のLLMと比べてGeminiには何か新しい機能があるかと尋ねられたとき、Google DeepMindの製品担当副社長であるEli Collins氏は「あると思います」と答えたが、同社はまだGemini Ultraaの新しい機能の理解に取り組んでいるところだ。

Google は、準備が整っていないため Gemini のリリースを延期したと報じられており、今年初めに同社が AI ツールの展開に苦戦していたことを思い出すことになる。

複数の記者が遅延について質問したところ、コリンズ氏は、より高度なモデルのテストには時間がかかると答えた。コリンズ氏は、ジェミニは同社がこれまでに構築したAIモデルの中で最も厳密にテストされたものであり、グーグルのモデルの中で「最も包括的な安全性評価」を受けていると述べた。

ジェミニ・ウルトラは最大モデルであるにもかかわらず、メンテナンス費用がはるかに安いとコリンズ氏は言う。 「能力が高まっただけでなく、効率も向上しました」と同氏は言う。「ジェミニを訓練するにはまだ多くのコンピューターが必要ですが、これらのモデルを訓練する能力はより効率的になってきています。」

コリンズ氏は、同社がこのモデルについての詳細を記載した技術白書を水曜日に発表する予定だが、円周数は公表しないと述べた。今年初め、ジャーナリストたちは、当時最新だった Google の AI モデル「Palm 2 Large Language Model」が、その前身である LLM のほぼ 5 倍の量のテキスト データでトレーニングされていることを発見しました。

また、水曜日にGoogleはAIモデルのトレーニング用次世代Tensor Processing Unitを発表した。グーグルは、セールスフォースと新興企業のライトリックス社が、2021年に発表されたTPU v4よりも優れた価格性能比を提供するTPU v5pチップの使用を開始したと述べたが、市場リーダーのエヌビディアと比較したパフォーマンスに関する情報は提供しなかった。

10月に行われたグーグルの第3四半期の決算発表の際、投資家らは同社がAIをいかにして実際の利益につなげていくのかについて幹部らにさらなる質問をぶつけた。

Google は 8 月に Search Generative Experiences (SGE) と呼ばれる初期の実験を開始しました。これは、検索エンジンを使用する際に GenAI エクスペリエンスがどのようなものになるかをユーザーが確認できるようにするものです。検索は依然として同社の主要な収益源であり、結果はチャットボットの時代を反映してより会話形式になっていますが、まだ実験段階と考えられており、一般には公開されていません。

ジェミニが5月に年次開発者会議「Google I/O」で初めてこの実験を発表して以来、投資家らはSGEのタイムラインを尋ねてきた。ジェミニの水曜日の発表ではSGEについてほとんど触れられず、幹部らは一般公開の計画については曖昧で、「今後1年以内に」ジェミニはSGEに統合されると述べている。

「このモデリングの新時代は、当社がこれまで取り組んできた科学と工学の取り組みの中でも最大のものの一つです」とピチャイ氏は水曜日のブログ投稿で述べた。「ジェミニが世界中の人々にもたらすであろう未来と機会に、私は本当に興奮しています。」

<<:  Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

>>:  Gemini vs ChatGPT: Google の最新 AI と ChatGPT のどちらが優れているのでしょうか?

ブログ    
ブログ    

推薦する

...

生成AIの構築には、大きなモデルだけでは不十分

生成型人工知能 (GenAI) の急速な台頭により、企業はビジネス アプリケーションでこのテクノロジ...

2021年12月のドローン業界の最新動向を3分で振り返る

[[442512]]現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の...

...

...

GPT-4が化学者になる! USTC などが初の「科学リスク」ベンチマークと SciGuard ビッグモデルを発表

「我々の実験は制御不能になった!これは我々の世界の終わりだ!」 - デイ・アフター・トゥモローSF映...

疫病流行後、自動運転開発の方向性がより明確になりました!

自動運転は長い間、人々に「とても人気があるが、とても遠い存在」という印象を与えてきました。それは、何...

Tmall のプログラマーがハイエンド アルゴリズムを使用して女の子を探す

問題は、アリ・タブロイド紙の公開記事によると: [[93064]] #p#これは本当の、そして少し悲...

クラウドプラットフォームにおける人工知能の応用は2020年に爆発的な成長を示すだろう

アクセンチュアのアナリストは、2020 年に企業がより多くのイノベーションを獲得するのはクラウド プ...

無料の AI ベスト論文検索ツール: ワンクリックで結果を表示し、数分で論文の表とデータを抽出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

ディープマインド主任科学者:私は機械知能よりも人間の知能が引き起こす災害を心配している

ディープマインドの主任研究科学者であり、ロンドン大学ユニバーシティ・カレッジのコンピューターサイエン...

将来、人工知能に置き換えられない仕事が最も収益性が高くなるでしょう。それがどれか見てみましょう。

誰もが知っているように、昔は銀行に行って業務を処理するには長い列に並ばなければなりませんでした。業務...

LiDARと視覚認識、どちらがトップに立つでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

快手コンテンツコールドスタートレコメンデーションモデルの実践

1. Kuaishou のコンテンツコールドスタートはどのような問題を解決しますか?まず、Kuais...