海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

12月8日のニュース、今週の水曜日、Googleは最新の人工知能モデルGeminiをリリースしました。 Google は、このモデルが一連の知能テストにおいて OpenAI の GPT-4 モデルや「熟練した」人間よりも優れていると主張しているが、技術的な指標の点では、Gemini は OpenAI の 8 か月前に発表された GPT-4 モデルよりわずかに優れているだけだ。

上記のニュースを受けて、グーグルの株価は木曜日の米国株式市場の終値で5.31%上昇して136.93ドルとなり、時価総額は1兆7000億ドルとなった。

1年前、GoogleはOpenAIのチャットボットChatGPTに不意を突かれ、それ以来、人工知能における自社の急速な進歩を描写することに熱心だった。グーグルは水曜日、手品のトリックを見破り、会計認定試験で好成績を収めることができる「ジェミニ」という新しい人工知能モデルを予定より早く突然リリースした。 Googleが公開したデモ動画もSNSで話題を呼んだが、技術的な観点から見ると、GoogleはまだOpenAIに追いついている段階だ。

Google Gemini と OpenAI のトップモデル GPT-4 のパフォーマンス比較から判断すると、Google の最も強力な Gemini Ultra は、高校物理学、専門的な法的テスト、倫理的なシナリオなどのほとんどのベンチマークテストで GPT-4 を上回っています。覚えておいてください、現在の AI 競争はこれらの機能によってほぼ完全に定義されます。

しかし、ほとんどのベンチマークでは、Gemini Ultra は GPT-4 を数パーセントしか上回りません。言い換えれば、Google のいわゆるトップ AI モデルは、少なくとも 1 年前に OpenAI が完成させた成果に比べてわずかに改善されただけのものである。

Google の言うとおり Gemini Ultra が 1 月初旬にリリースされた場合、トップ AI モデルのリストのトップに長く留まることはできないかもしれません。 Google が OpenAI に追いつこうと努力する中、OpenAI には次世代の人工知能モデル GPT-5 を開発するのにほぼ 1 年の期間がある。

Google が Social Media X に投稿したデモ ビデオは、一見すると印象的です。 Google の AI モデルは、プラスチックのカップの下の紙のボールを追跡したり、画像の輪郭を描く前にそれがカニであると推測したりすることができ、Google の DeepMind AI ラボで長年にわたり訓練されてきた強力な推論能力を実証しています。これは他の AI モデルにはない機能です。しかし、ビデオで紹介されている他の機能の多くは Google 独自のものではありません。ChatGPT Plus3 でも同様の機能があり、ウォートン大学のイーサン・モリック教授が実験的に実証しています。

さらに、Googleはデモ動画が編集されていたことも認めた。 「このデモを実現するために、レイテンシを減らし、ジェミニの出力を圧縮しました」と同社はビデオの説明で述べている。つまり、モデルが応答するのにかかる時間は、実際にはビデオに示されている時間よりも長くなるということだ。

実際、デモンストレーションはリアルタイムではなく、音声による対話では完了しませんでした。グーグルの広報担当者は、このビデオは「ビデオの静止画像フレームとテキストを使用して作成された」と述べた。ジェスチャー、絵、または他のオブジェクトの写真を通じて、他のユーザーが Gemini と対話する方法を紹介する Web サイトがあります。つまり、デモ ビデオの音声は、Gemini に与えられた人工的なプロンプトを説明しているだけであり、Gemini の出力は依然として静止画像のままです。これは、人間が Gemini と流暢に会話でき、モデルが周囲の世界をリアルタイムで観察して反応できるという Google の示唆と矛盾しているように思われます。

また、デモンストレーションビデオでは、展示されているモデルがジェミニ ウルトラ人工知能モデルであることも明記されていませんでした。詳細から、Google はマーケティング活動に力を入れており、同社が世界最大級の AI 研究チームを擁し、他のどの企業よりも多くのデータにアクセスできることを人々に覚えてもらいたいと考えていることがうかがえる。 Googleは水曜日に実施したように、Chrome、Android、Pixelスマートフォンのエンドデバイス向けにGeminiモデルをリリースし、同社の展開ネットワークがいかに大規模であるかを人々に思い出させたいと考えている。

しかし、テクノロジー業界では、どこにでもあることが必ずしも見た目ほど有利であるとは限りません。初期の携帯電話大手 Nokia (および BlackBerry) は、Apple がより高性能で直感的な iPhone で自社の市場シェアを奪ったことで、このことを痛感しました。ソフトウェアの世界では、商業的な成功は多くの場合、最高のパフォーマンスを発揮するシステムから生まれます。

Google のこの動きは、OpenAI の最近の混乱を利用しようとする試みであることはほぼ間違いない。 OpenAIの取締役会がCEOのサム・アルトマン氏を一時的に解任したと報じられ、同社の将来が危ぶまれる中、GoogleはすぐにOpenAIの法人顧客にGoogleに乗り換えるよう説得するマーケティングキャンペーンを開始した。現在、Gemini のリリースにより、Google はその不確実性を利用しようとしているようです。

しかし、このデモの効果は限られていた。 Google はこれまでにも新しいテクノロジーを披露してきましたが、何も進展しませんでした。これまでのところ、Google の広大な組織構造と階層化された製品マネージャー体制により、OpenAI ほど機敏に製品をリリースすることができていない。社会が人工知能の変革的影響に取り組む中、Google の最新の動きは悪いことではないが、その有効性はまだ分からない。確かに、Google はまだ追いついている最中です。

<<:  すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

デジタルイノベーション:次の世界的危機に対応するための重要な要素

世界的なCOVID-19危機は依然として猛威を振るっていますが、一部の組織はすでに将来のパンデミック...

顔認証がまたもや放棄される。米国に続いて今度はEUの番

近年、人工知能の継続的な台頭により、顔認識が広く使用されるようになり、「顔スキャン」の時代が静かに到...

古典的なソートアルゴリズムヒープソートの簡単な分析

ヒープは通常、(完全な) ツリーとして表示できるオブジェクトの配列です。そして、以下のルールは常に満...

BiLSTMとCRFアルゴリズムを徹底的に理解する

CRF は、品詞タグ付け、単語分割、固有表現認識などのタスクに使用できる、一般的に使用されるシーケン...

仮想通貨取引ロボットが手動取引に取って代わり、システム開発が進む

定量取引は高頻度取引の一種です。毎日無数の取引ペアが生成されます。手動で行う場合、多くの市場機会が不...

...

OpenAI は PyTorch、TensorFlow を全面的に採用していますが、なぜそれほど優れていないのでしょうか?

TensorFlow と PyTorch フレームワーク間の戦いは長い間続いています。最近のニュー...

知っておくべき6つのオープンソースAIツール

[[236435]]誰でも使用できる無料のオープンソース AI ツールをいくつか見てみましょう。オー...

聞いてください、トランスフォーマーはサポートベクターマシンです

Transformer は、学界で議論を巻き起こしたサポート ベクター マシン (SVM) の新しい...

DAMOアカデミー物流ロボットQA

1. 物流ロボットとは?物流ロボット「Xiaomanlu」は、ターミナル物流シナリオ向けに設計され...

...

...

2020年までに、iPhoneでは画面指紋認証と顔認証が共存するようになるかもしれない

数日後には、2019 年の新しい iPhone シリーズが登場します。iPhone が Face I...