GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

大規模な言語モデリングにヒントを得て、Deepmind は同様のアプローチを適用し、マルチモーダル、マルチタスク、マルチ具現化を備え、600 を超えるさまざまなタスクを実行できる単一の「ジェネラリスト」エージェント Gato を構築しました。この AI は、おそらく世界がこれまでに見た中で最も印象的なオールインワンの機械学習スイートです。

DeepMindは公式ブログ投稿で次のように説明した。

「Gatoは、マルチモーダル、マルチタスク、マルチコンポーネントの汎用人工知能です。同じネットワーク条件下で、Atariゲームをプレイしたり、画像にキャプションを追加したり、人とチャットしたり、ロボットアームを制御してブロックを積み重ねたりすることができます。現在の状況に応じて、テキストを出力するか、ロボットアームを回転させるか、ボタンを押すか、その他のマークを付けるかを決定します。」

Gato のパフォーマンスがどの程度優れているかはまだ不明ですが、GPT-3 が達成できると期待できるものを超えているようです。

画像出典: DeepMind公式サイト

Gato は本当に GPT-3 を超えるのでしょうか?

GPT-3 は、資金力のある汎用人工知能 (AGI) 企業である OpenAI によって作成された大規模言語モデル (LLM) です。同社はマイクロソフトから数十億ドルの支援を受けているだけでなく、米国政府の規制も受けており、基本的に何でもできる。

同社が注力する汎用人工知能（AGI）は、人間のような知能を持ち、人間が実行できるあらゆる知的タスクを実行できるAIである。一部の研究者は、汎用人工知能を「強い AI」または「完全な AI」、あるいは一般的な知的アクションを実行する能力を持つマシンと呼んでいます。弱い AI と比較すると、強い AI は人間の認知能力を完全に備えています。

もともと、OpenAI の使命は AGI の開発と制御でしたが、現実には同社が作成できたのは非常に高度な LLM だけであり、当初の意図とは多少矛盾しています。

GPT-3 と DeepMind の Gato は素晴らしいものですが、一般の人々がそれらを評価する基準には、ある程度のニュアンスが必要です。

OpenAI が AGI への道で LLM ルートを採用している理由は単純です。AGI を機能させる方法を誰も知らないからです。火の発見から内燃機関の発明までに長い時間がかかったのと同じように、ディープラーニングから AGI に移行する方法を見つけるのも一夜にしてできることではありません。それでも、GPT-3 はテキストの生成など、人間のような動作を実行できます。

「汎用人工知能」を標榜する Gato は、GPT-3 とほぼ同じことを行います。これは、LLM と非常によく似た仕組みを単純に組み合わせて、600 以上のトリックを実行できる「マジシャン」を生み出しました。そのハイライトは、単一のシーケンスモデルを使用してすべてのタスクを解決することですが、トレーニングデータの量と多様性を増やす必要があります。

Gato のマルチタスク機能は、600 通りの方法でプレイできるゲームというより、600 種類のゲームを保存できるゲームコンソールに似ています。これは、説明されているような汎用的な人工知能ではなく、事前にトレーニングされた一連の限定されたモデルがきちんとまとめられたものです。

画像出典: DeepMind公式サイト

Knives and Paintbrushes の Mike Cook 氏は最近、TechCrunch の Kyle Wiggers 氏に次のように語っています。

「Gato のような AI が、非常に異なって聞こえるこれらのタスクをすべて実行できるのは、非常に興味深いことです。なぜなら、私たちにとって、テキストを書くこととロボットを制御することは非常に異なって聞こえるからです。
しかし実際には、これは GPT-3 が通常の英語のテキストと Python コードを理解するのとあまり変わりません。
これを実現するのは簡単ではありませんが、外部の観察者にとっては、AI がお茶を淹れたり、10 個から 50 個の他のタスクを簡単に学習したりできるように見えるかもしれませんが、実際にはそれらのいずれも実行できません。 ”

要約すると、Gato と GPT-3 はどちらも強力な AI システムですが、どちらも汎用的な知能の機能を備えていません。

AGI 時代はいつ来るのでしょうか?

DeepMindは10年以上AGIに取り組んでおり、OpenAIは2015年にスタートしました。しかし、どちらも AGI への道の最初の問題、つまりトレーニングなしで新しいことを学習できる AI の構築を解決していません。

AGI が幸運の結果であると賭けているのでなければ、これらの企業がこの分野でどのように進歩しているかを再評価する時期が来ています。

おそらく、Gato は世界で最も先進的なマルチモーダル人工知能システムかもしれません。しかし、DeepMind は、OpenAI と同様に AGI を行き詰まらせた同じ概念を採用し、それをより市場性の高いものにしたのです。

Gato はマーケティングを通じて、Alexa、Siri、Google Assistant よりも消費者市場で支持を得られる可能性があります。しかし、Gato と GPT-3 は、前述の仮想アシスタントよりも AGI へのより現実的なエントリポイントではありません。

これがあなたが探している AI の種類であれば、それは悪いことではありません。しかし、ガトー氏の付随研究論文には、それが AGI への足がかりになるどころか、AGI に向けて正しい方向に進んでいるという証拠はまったくありません。

<<: Tフロントライン | テンセントAILabとの独占インタビュー：「点」から「線」へ、実験室は単なる実験以上のもの

>>: 顔認識技術の倫理

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

Gato は本当に GPT-3 を超えるのでしょうか?

AGI 時代はいつ来るのでしょうか?

宜春市はファーウェイと提携し、ビッグデータと人工知能で市のデジタル変革を推進

中国科学院は、プログラマーがバグを見つけるのを助けるために大きなモデルを使用し、102の論文を分析し、これらの解決策をまとめた。

fBox アルゴリズムを使用して、高度に隠蔽された詐欺ユーザーを検出する方法

AIは世界を席巻しており、すべての関係者がアプリケーションの導入に力を入れており、競争は激化している。

新たなAI詐欺事件が発覚！「人工知能」は「インテリジェントな人工知能」ほど優れていないのでしょうか?

Google X 中国博士がロボットシミュレーターSimGANをリリース、ICLR2021が出版

先頭に立つのはロボット工学の専門家ダニエラ・ルスです! MIT の新しいアルゴリズムにより、ソフトロボットの「固有受容感覚」が実現

将来、軍隊は完全に人工知能になるのでしょうか?空想するのはやめてください！全体的な傾向と方向性は変えられない

機械学習の未来

推薦する

人工知能の次の段階として、なぜインターネットの巨人に期待すべきなのでしょうか?

米国が新たなオープンソースAIアルゴリズムを開発：モザイクの美しさを自動修復

3分レビュー！ 2021年1月のドローン業界の重要な動向の概要

チャットボットをよりエレガントに設計する方法

銀行業務における人工知能と機械学習の利用拡大

2019年、AI技術は製造業が小さな努力で大きな成果を達成するのを助けるだろう

単一ニューロンは将来の活動を予測することで学習し、脳の働きを説明するのに役立つ。

住宅価格予測のための機械学習

Transformer を画像セマンティックセグメンテーションに使用し、最先端の畳み込み手法を上回るパフォーマンスを実現

顔認識のグレーな業界チェーンを解明: あなたの顔情報にはどれくらいの価値があるのでしょうか?