海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

12月8日のニュース、今週の水曜日、Googleは最新の人工知能モデルGeminiをリリースしました。 Google は、このモデルが一連の知能テストにおいて OpenAI の GPT-4 モデルや「熟練した」人間よりも優れていると主張しているが、技術的な指標の点では、Gemini は OpenAI の 8 か月前に発表された GPT-4 モデルよりわずかに優れているだけだ。

上記のニュースを受けて、グーグルの株価は木曜日の米国株式市場の終値で5.31%上昇して136.93ドルとなり、時価総額は1兆7000億ドルとなった。

1年前、GoogleはOpenAIのチャットボットChatGPTに不意を突かれ、それ以来、人工知能における自社の急速な進歩を描写することに熱心だった。グーグルは水曜日、手品のトリックを見破り、会計認定試験で好成績を収めることができる「ジェミニ」という新しい人工知能モデルを予定より早く突然リリースした。 Googleが公開したデモ動画もSNSで話題を呼んだが、技術的な観点から見ると、GoogleはまだOpenAIに追いついている段階だ。

Google Gemini と OpenAI のトップモデル GPT-4 のパフォーマンス比較から判断すると、Google の最も強力な Gemini Ultra は、高校物理学、専門的な法的テスト、倫理的なシナリオなどのほとんどのベンチマークテストで GPT-4 を上回っています。覚えておいてください、現在の AI 競争はこれらの機能によってほぼ完全に定義されます。

しかし、ほとんどのベンチマークでは、Gemini Ultra は GPT-4 を数パーセントしか上回りません。言い換えれば、Google のいわゆるトップ AI モデルは、少なくとも 1 年前に OpenAI が完成させた成果に比べてわずかに改善されただけのものである。

Google の言うとおり Gemini Ultra が 1 月初旬にリリースされた場合、トップ AI モデルのリストのトップに長く留まることはできないかもしれません。 Google が OpenAI に追いつこうと努力する中、OpenAI には次世代の人工知能モデル GPT-5 を開発するのにほぼ 1 年の期間がある。

Google が Social Media X に投稿したデモ ビデオは、一見すると印象的です。 Google の AI モデルは、プラスチックのカップの下の紙のボールを追跡したり、画像の輪郭を描く前にそれがカニであると推測したりすることができ、Google の DeepMind AI ラボで長年にわたり訓練されてきた強力な推論能力を実証しています。これは他の AI モデルにはない機能です。しかし、ビデオで紹介されている他の機能の多くは Google 独自のものではありません。ChatGPT Plus3 でも同様の機能があり、ウォートン大学のイーサン・モリック教授が実験的に実証しています。

さらに、Googleはデモ動画が編集されていたことも認めた。 「このデモを実現するために、レイテンシを減らし、ジェミニの出力を圧縮しました」と同社はビデオの説明で述べている。つまり、モデルが応答するのにかかる時間は、実際にはビデオに示されている時間よりも長くなるということだ。

実際、デモンストレーションはリアルタイムではなく、音声による対話では完了しませんでした。グーグルの広報担当者は、このビデオは「ビデオの静止画像フレームとテキストを使用して作成された」と述べた。ジェスチャー、絵、または他のオブジェクトの写真を通じて、他のユーザーが Gemini と対話する方法を紹介する Web サイトがあります。つまり、デモ ビデオの音声は、Gemini に与えられた人工的なプロンプトを説明しているだけであり、Gemini の出力は依然として静止画像のままです。これは、人間が Gemini と流暢に会話でき、モデルが周囲の世界をリアルタイムで観察して反応できるという Google の示唆と矛盾しているように思われます。

また、デモンストレーションビデオでは、展示されているモデルがジェミニ ウルトラ人工知能モデルであることも明記されていませんでした。詳細から、Google はマーケティング活動に力を入れており、同社が世界最大級の AI 研究チームを擁し、他のどの企業よりも多くのデータにアクセスできることを人々に覚えてもらいたいと考えていることがうかがえる。 Googleは水曜日に実施したように、Chrome、Android、Pixelスマートフォンのエンドデバイス向けにGeminiモデルをリリースし、同社の展開ネットワークがいかに大規模であるかを人々に思い出させたいと考えている。

しかし、テクノロジー業界では、どこにでもあることが必ずしも見た目ほど有利であるとは限りません。初期の携帯電話大手 Nokia (および BlackBerry) は、Apple がより高性能で直感的な iPhone で自社の市場シェアを奪ったことで、このことを痛感しました。ソフトウェアの世界では、商業的な成功は多くの場合、最高のパフォーマンスを発揮するシステムから生まれます。

Google のこの動きは、OpenAI の最近の混乱を利用しようとする試みであることはほぼ間違いない。 OpenAIの取締役会がCEOのサム・アルトマン氏を一時的に解任したと報じられ、同社の将来が危ぶまれる中、GoogleはすぐにOpenAIの法人顧客にGoogleに乗り換えるよう説得するマーケティングキャンペーンを開始した。現在、Gemini のリリースにより、Google はその不確実性を利用しようとしているようです。

しかし、このデモの効果は限られていた。 Google はこれまでにも新しいテクノロジーを披露してきましたが、何も進展しませんでした。これまでのところ、Google の広大な組織構造と階層化された製品マネージャー体制により、OpenAI ほど機敏に製品をリリースすることができていない。社会が人工知能の変革的影響に取り組む中、Google の最新の動きは悪いことではないが、その有効性はまだ分からない。確かに、Google はまだ追いついている最中です。

<<:  すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10

>>: 

ブログ    
ブログ    
ブログ    

推薦する

ChatGPT が「Paper Artifact」プラグインをリリースしました。キーワードなしで2億件の記事を検索、リンクは完全に本物です

ChatGPT には、「Consensus」と呼ばれる新しい「論文検索アーティファクト」プラグインが...

K8S向け機械学習ツール「Kubeflow」の詳しい解説

[51CTO.com オリジナル記事] Kubeflowには多くのコンポーネントがあり、各コンポーネ...

開発者の「第2の脳」が登場、GitHub Copilotがアップデートされ、人間の開発参加がさらに減少

Andrej Karpathy 氏が嘆くのは、ソフトウェア開発プロセスにおいてコードを直接記述するこ...

世界情報会議が開幕、ロビン・リー、ジャック・マー、劉伝志ら著名人が集結

【51CTO天津6月29日】本日、「偉大な知能時代へ向かう」をテーマとする世界知能会議が天津梅江会議...

AutoML 2.0: データ サイエンティストは時代遅れか?

AutoML はここ数年で急速に成長しました。そして、景気後退が避けられない状況となった今、人工知...

JavaScript における一般的なソートアルゴリズムの詳細な説明

諺にこうあります:雷鋒が雷鋒塔を倒し、Java が JavaScript を実装します。 Java ...

多くの場所でAI顔認識の使用が制限されており、監視は技術開発のペースに追いついています

最近、南京、江蘇省、天津などではAI顔認識技術の使用を禁止し始めている。 11月末、南京市のある男性...

...

マイクロソフトが第1四半期の業績報告を発表: AIサービスの需要が事業成長を牽引

マイクロソフトは10月25日、2024年第1四半期の財務報告を発表した。AI製品とクラウド事業の成長...

人工知能はスポーツや芸術教育における革新的な発展をどのように促進できるのでしょうか?

[[407981]]著者テンセント研究所の上級研究員、周丹氏趙雲傑 テンセント研究所 研究助手20...

DevOps で AI を使用して非線形スケーリングを実現する方法

テクノロジーが飛躍的に進歩するにつれ、AI はスピード、スケーラビリティ、品質、柔軟性を求めるあらゆ...

2つのセッションが始まります!自動運転とスマートカーに関する最新の提案13選

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

...

AIは感情に関してより賢くなってきているのでしょうか?人間もそうすべきだ

人々は、一人でいるときと公共の場では行動が大きく異なりますが、基本的な性格は同じままです。観客のいな...