GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

大規模な言語モデリングにヒントを得て、Deepmind は同様のアプローチを適用し、マルチモーダル、マルチタスク、マルチ具現化を備え、600 を超えるさまざまなタスクを実行できる単一の「ジェネラリスト」エージェント Gato を構築しました。この AI は、おそらく世界がこれまでに見た中で最も印象的なオールインワンの機械学習スイートです。

DeepMindは公式ブログ投稿で次のように説明した。

「Gatoは、マルチモーダル、マルチタスク、マルチコンポーネントの汎用人工知能です。同じネットワーク条件下で、Atariゲームをプレイしたり、画像にキャプションを追加したり、人とチャットしたり、ロボットアームを制御してブロックを積み重ねたりすることができます。現在の状況に応じて、テキストを出力するか、ロボットアームを回転させるか、ボタンを押すか、その他のマークを付けるかを決定します。」

Gato のパフォーマンスがどの程度優れているかはまだ不明ですが、GPT-3 が達成できると期待できるものを超えているようです。

画像出典: DeepMind公式サイト

Gato は本当に GPT-3 を超えるのでしょうか?

GPT-3 は、資金力のある汎用人工知能 (AGI) 企業である OpenAI によって作成された大規模言語モデル (LLM) です。同社はマイクロソフトから数十億ドルの支援を受けているだけでなく、米国政府の規制も受けており、基本的に何でもできる。

同社が注力する汎用人工知能(AGI)は、人間のような知能を持ち、人間が実行できるあらゆる知的タスクを実行できるAIである。一部の研究者は、汎用人工知能を「強い AI」または「完全な AI」、あるいは一般的な知的アクションを実行する能力を持つマシンと呼んでいます。弱い AI と比較すると、強い AI は人間の認知能力を完全に備えています。

もともと、OpenAI の使命は AGI の開発と制御でしたが、現実には同社が作成できたのは非常に高度な LLM だけであり、当初の意図とは多少矛盾しています。

GPT-3 と DeepMind の Gato は素晴らしいものですが、一般の人々がそれらを評価する基準には、ある程度のニュアンスが必要です。

OpenAI が AGI への道で LLM ルートを採用している理由は単純です。AGI を機能させる方法を誰も知らないからです。火の発見から内燃機関の発明までに長い時間がかかったのと同じように、ディープラーニングから AGI に移行する方法を見つけるのも一夜にしてできることではありません。それでも、GPT-3 はテキストの生成など、人間のような動作を実行できます。

「汎用人工知能」を標榜する Gato は、GPT-3 とほぼ同じことを行います。これは、LLM と非常によく似た仕組みを単純に組み合わせて、600 以上のトリックを実行できる「マジシャン」を生み出しました。そのハイライトは、単一のシーケンス モデルを使用してすべてのタスクを解決することですが、トレーニング データの量と多様性を増やす必要があります。

Gato のマルチタスク機能は、600 通りの方法でプレイできるゲームというより、600 種類のゲームを保存できるゲーム コンソールに似ています。これは、説明されているような汎用的な人工知能ではなく、事前にトレーニングされた一連の限定されたモデルがきちんとまとめられたものです。

画像出典: DeepMind公式サイト

Knives and Paintbrushes の Mike Cook 氏は最近、TechCrunch の Kyle Wiggers 氏に次のように語っています。

「Gato のような AI が、非常に異なって聞こえるこれらのタスクをすべて実行できるのは、非常に興味深いことです。なぜなら、私たちにとって、テキストを書くこととロボットを制御することは非常に異なって聞こえるからです。

しかし実際には、これは GPT-3 が通常の英語のテキストと Python コードを理解するのとあまり変わりません。

これを実現するのは簡単ではありませんが、外部の観察者にとっては、AI がお茶を淹れたり、10 個から 50 個の他のタスクを簡単に学習したりできるように見えるかもしれませんが、実際にはそれらのいずれも実行できません。 ”

要約すると、Gato と GPT-3 はどちらも強力な AI システムですが、どちらも汎用的な知能の機能を備えていません。

AGI 時代はいつ来るのでしょうか?

DeepMindは10年以上AGIに取り組んでおり、OpenAIは2015年にスタートしました。しかし、どちらも AGI への道の最初の問題、つまりトレーニングなしで新しいことを学習できる AI の構築を解決していません。

AGI が幸運の結果であると賭けているのでなければ、これらの企業がこの分野でどのように進歩しているかを再評価する時期が来ています。

おそらく、Gato は世界で最も先進的なマルチモーダル人工知能システムかもしれません。しかし、DeepMind は、OpenAI と同様に AGI を行き詰まらせた同じ概念を採用し、それをより市場性の高いものにしたのです。

Gato はマーケティングを通じて、Alexa、Siri、Google Assistant よりも消費者市場で支持を得られる可能性があります。しかし、Gato と GPT-3 は、前述の仮想アシスタントよりも AGI へのより現実的なエントリ ポイントではありません。

これがあなたが探している AI の種類であれば、それは悪いことではありません。しかし、ガトー氏の付随研究論文には、それが AGI への足がかりになるどころか、AGI に向けて正しい方向に進んでいるという証拠はまったくありません。

<<:  Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

>>:  顔認識技術の倫理

ブログ    

推薦する

...

...

人工知能の次の段階として、なぜインターネットの巨人に期待すべきなのでしょうか?

過去10年間を振り返ると、人工知能の進歩は「目覚ましい」ものと言えます。特に2015年にAlphaG...

米国が新たなオープンソースAIアルゴリズムを開発:モザイクの美しさを自動修復

ぼやけた写真を見ると、本来の姿を復元したいという衝動にかられることはありませんか?以前の技術ではこれ...

3分レビュー! 2021年1月のドローン業界の重要な動向の概要

2020年の最初の月はあっという間に過ぎましたが、ドローン業界の発展は多くの原動力と章を残しました。...

チャットボットをよりエレガントに設計する方法

AI アルゴリズムの人気により、近年会話型ロボットの人気が高まり、あらゆる分野で推進され、使用されて...

...

銀行業務における人工知能と機械学習の利用拡大

[[432637]]銀行ガバナンスリーダーシップネットワーク(BGLN)は最近、銀行が人工知能(AI...

2019年、AI技術は製造業が小さな努力で大きな成果を達成するのを助けるだろう

[[251579]] 2019 年には、新世代の人工知能 (AI) ソリューションが注目を集めるでし...

単一ニューロンは将来の活動を予測することで学習し、脳の働きを説明するのに役立つ。

何世紀にもわたり、人類は脳がどのように機能し、どのように情報を獲得するかを理解しようとしてきました。...

...

住宅価格予測のための機械学習

序文Python は機械学習において当然の利点を持っているので、今日から機械学習技術に取り組んでみま...

...

顔認識のグレーな業界チェーンを解明: あなたの顔情報にはどれくらいの価値があるのでしょうか?

顔認識技術は国民の自由に深刻な脅威を与えるほど強力になっている。それにもかかわらず、業界は繁栄し続け...