海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

12月8日のニュース、今週の水曜日、Googleは最新の人工知能モデルGeminiをリリースしました。 Google は、このモデルが一連の知能テストにおいて OpenAI の GPT-4 モデルや「熟練した」人間よりも優れていると主張しているが、技術的な指標の点では、Gemini は OpenAI の 8 か月前に発表された GPT-4 モデルよりわずかに優れているだけだ。

上記のニュースを受けて、グーグルの株価は木曜日の米国株式市場の終値で5.31%上昇して136.93ドルとなり、時価総額は1兆7000億ドルとなった。

1年前、GoogleはOpenAIのチャットボットChatGPTに不意を突かれ、それ以来、人工知能における自社の急速な進歩を描写することに熱心だった。グーグルは水曜日、手品のトリックを見破り、会計認定試験で好成績を収めることができる「ジェミニ」という新しい人工知能モデルを予定より早く突然リリースした。 Googleが公開したデモ動画もSNSで話題を呼んだが、技術的な観点から見ると、GoogleはまだOpenAIに追いついている段階だ。

Google Gemini と OpenAI のトップモデル GPT-4 のパフォーマンス比較から判断すると、Google の最も強力な Gemini Ultra は、高校物理学、専門的な法的テスト、倫理的なシナリオなどのほとんどのベンチマークテストで GPT-4 を上回っています。覚えておいてください、現在の AI 競争はこれらの機能によってほぼ完全に定義されます。

しかし、ほとんどのベンチマークでは、Gemini Ultra は GPT-4 を数パーセントしか上回りません。言い換えれば、Google のいわゆるトップ AI モデルは、少なくとも 1 年前に OpenAI が完成させた成果に比べてわずかに改善されただけのものである。

Google の言うとおり Gemini Ultra が 1 月初旬にリリースされた場合、トップ AI モデルのリストのトップに長く留まることはできないかもしれません。 Google が OpenAI に追いつこうと努力する中、OpenAI には次世代の人工知能モデル GPT-5 を開発するのにほぼ 1 年の期間がある。

Google が Social Media X に投稿したデモ ビデオは、一見すると印象的です。 Google の AI モデルは、プラスチックのカップの下の紙のボールを追跡したり、画像の輪郭を描く前にそれがカニであると推測したりすることができ、Google の DeepMind AI ラボで長年にわたり訓練されてきた強力な推論能力を実証しています。これは他の AI モデルにはない機能です。しかし、ビデオで紹介されている他の機能の多くは Google 独自のものではありません。ChatGPT Plus3 でも同様の機能があり、ウォートン大学のイーサン・モリック教授が実験的に実証しています。

さらに、Googleはデモ動画が編集されていたことも認めた。 「このデモを実現するために、レイテンシを減らし、ジェミニの出力を圧縮しました」と同社はビデオの説明で述べている。つまり、モデルが応答するのにかかる時間は、実際にはビデオに示されている時間よりも長くなるということだ。

実際、デモンストレーションはリアルタイムではなく、音声による対話では完了しませんでした。グーグルの広報担当者は、このビデオは「ビデオの静止画像フレームとテキストを使用して作成された」と述べた。ジェスチャー、絵、または他のオブジェクトの写真を通じて、他のユーザーが Gemini と対話する方法を紹介する Web サイトがあります。つまり、デモ ビデオの音声は、Gemini に与えられた人工的なプロンプトを説明しているだけであり、Gemini の出力は依然として静止画像のままです。これは、人間が Gemini と流暢に会話でき、モデルが周囲の世界をリアルタイムで観察して反応できるという Google の示唆と矛盾しているように思われます。

また、デモンストレーションビデオでは、展示されているモデルがジェミニ ウルトラ人工知能モデルであることも明記されていませんでした。詳細から、Google はマーケティング活動に力を入れており、同社が世界最大級の AI 研究チームを擁し、他のどの企業よりも多くのデータにアクセスできることを人々に覚えてもらいたいと考えていることがうかがえる。 Googleは水曜日に実施したように、Chrome、Android、Pixelスマートフォンのエンドデバイス向けにGeminiモデルをリリースし、同社の展開ネットワークがいかに大規模であるかを人々に思い出させたいと考えている。

しかし、テクノロジー業界では、どこにでもあることが必ずしも見た目ほど有利であるとは限りません。初期の携帯電話大手 Nokia (および BlackBerry) は、Apple がより高性能で直感的な iPhone で自社の市場シェアを奪ったことで、このことを痛感しました。ソフトウェアの世界では、商業的な成功は多くの場合、最高のパフォーマンスを発揮するシステムから生まれます。

Google のこの動きは、OpenAI の最近の混乱を利用しようとする試みであることはほぼ間違いない。 OpenAIの取締役会がCEOのサム・アルトマン氏を一時的に解任したと報じられ、同社の将来が危ぶまれる中、GoogleはすぐにOpenAIの法人顧客にGoogleに乗り換えるよう説得するマーケティングキャンペーンを開始した。現在、Gemini のリリースにより、Google はその不確実性を利用しようとしているようです。

しかし、このデモの効果は限られていた。 Google はこれまでにも新しいテクノロジーを披露してきましたが、何も進展しませんでした。これまでのところ、Google の広大な組織構造と階層化された製品マネージャー体制により、OpenAI ほど機敏に製品をリリースすることができていない。社会が人工知能の変革的影響に取り組む中、Google の最新の動きは悪いことではないが、その有効性はまだ分からない。確かに、Google はまだ追いついている最中です。

<<:  すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10

>>: 

ブログ    
ブログ    
ブログ    

推薦する

パーソナライズされた推奨事項は、馴染みのあるものに偏っていますか?アルゴリズムは公平性を侵害できない

北京日報によると、異なる消費者が同じ電子商取引プラットフォーム上で同じキーワードを使用して商品を検索...

調査レポート:世界中の企業の75%が職場でのChatGPTの使用を禁止または禁止を検討中

8月9日、BlackBerryは新たな調査レポートを発表し、現在、世界中の企業の75%が職場でのCh...

教師あり学習、教師なし学習、半教師あり学習、強化学習の 4 つのディープラーニング手法を 1 つの記事で理解する

一般的に、ディープラーニング ネットワークをトレーニングする方法には、教師あり学習、教師なし学習、半...

再帰アルゴリズムと最適化アルゴリズムの比較

以前、「【インタビュー】 - 低速反応再帰」で 3 つの再帰アルゴリズムを読みました。フィボナッチ数...

見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

顔認識技術のまとめ:従来の方法からディープラーニングまで

英国ハートフォードシャー大学とGBG社の研究者らは最近、顔認識のさまざまな従来の手法と現在流行してい...

AI 開発者の高額給与は魅力的すぎるでしょうか?国内の開発者がAIに変革するためのガイドをぜひご利用ください

著者注: AI関連のニュースを閲覧すると、「高給」「年収100万ドル」など、非常に魅力的な言葉が頻繁...

650億のパラメータ、すべてのパラメータを8つのGPUで微調整可能:Qiu Xipengのチームは大規模モデルの閾値を下げました

大規模モデルに向けて、テクノロジー大手はより大規模なモデルをトレーニングしており、学界はそれらを最適...

「顔をスキャン」すると、実はリスクが伴う。顔認識、個人情報保護の観点から

[[417904]]例:2020年6月、杭州市阜陽区人民法院は、郭兵と杭州野生動物公園との間のサービ...

...

AIは科学者のツールになり得るか? Nature がトップクラスの学者 5 人にインタビュー: コードの書き方を学び、期待を下げよう

[[430245]]人工知能(AI)は、専用の研究分野から他の分野のツールへと徐々に移行しており、学...

...

CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる

人生で、私たちは誰でもぼやけた画像に遭遇します。昔は、ぼやけた画像を復元することは不可能でした。PS...

人工知能におけるコンピュータビジョンとは

人工知能(AI)には、「学習意欲を持つインテリジェントエージェント」の開発が伴います。さまざまなアク...

...