ゲームオーバー？強いAIと弱いAIの戦い

数週間前、Googleの人工知能（AI）子会社DeepMindが、Gato（同じトレーニング済みモデルを使用してさまざまなタスクを実行できるエージェント）と呼ばれる「ジェネラリスト」エージェントについて説明し、人工汎用知能（AGI）は純粋な規模によって実現可能であると主張する論文を発表して以来、AI業界では多くの議論が交わされている。少し学術的に思えるかもしれませんが、現実には、汎用人工知能が間近に迫っているとしても、法律、規制、経済モデルを含む私たちの社会はまだ準備ができていません。

実際、同じトレーニング済みモデルのおかげで、ジェネラリストエージェント Gato は、Atari をプレイしたり、写真にキャプションを付けたり、チャットしたり、実際のロボットアームでブロックを積み重ねたりすることができます。また、コンテキストに基づいて、テキスト、接続トルク、ボタンの押下、またはその他のマーカーを出力するかどうかを決定することもできます。したがって、これは、自然言語の記述、言語の理解、説明からの画像の作成など、非常に限定された特定のタスクに非常に優れている、人気の GPT-3、DALL-E 2、PaLM、Flamingo よりも、より一般的な AI モデルのように見えます。

これを受けて、DeepMind の科学者でありオックスフォード大学の教授でもある Nando de Freitas 氏は、「今やすべては規模の問題だ! ゲームオーバーだ!」と主張し、完全なスケーリング (つまり、より大きなモデル、より大きなトレーニングデータセット、およびより高い計算能力) によって汎用人工知能 (AGI) を実現できると主張しました。しかし、デ・フレイタスが語っている「ゲーム」とは何なのでしょうか?この議論は一体何なのでしょうか?

人工知能の戦い: 強いAI vs. 弱いAI

この議論の詳細とそれが社会全体に与える影響について議論する前に、一歩下がって背景を理解する必要があります。

「人工知能」という用語の意味は長年にわたって変化してきましたが、高レベルかつ一般的な観点からは、環境を認識し、目標を達成する可能性を最大化するために行動するあらゆるシステムを指すインテリジェントエージェントの研究分野として定義できます。この定義は、エージェントやマシンが実際に「考える」かどうかという、長い間激しい議論の対象となってきた問題を意図的に除外しています。 1950年、イギリスの数学者アラン・チューリングは、有名な論文『模倣ゲーム』の中で、機械が考えることができるかどうかを考えるよりも、「機械が知的な行動を示すことが可能かどうか」に焦点を当てた方が良いと主張した。

この区別は概念的には、強い AI と弱い AI という 2 つの主要な人工知能の分野につながります。強力な AI は、人工汎用知能 (AGI) とも呼ばれ、機械が人間と同じ知能を持つ必要がある AI の理論的な形式です。その結果、自己認識力、問題解決能力、学習能力、将来計画能力が備わります。これは AI の最も野心的な定義であり、「AI の聖杯」ですが、現時点では、あくまでも理論上のものです。強力な AI を実現するためのアプローチは、通常、シンボリック AI を中心に展開されます。シンボリック AI では、マシンが物理的および抽象的な「世界」の両方の内部シンボリック表現を形成し、ルールや推論を適用してさらに学習し、意思決定を行うことができます。

この分野の研究は継続していますが、世界の内部表現や象徴的表現は規模が大きくなるにつれてすぐに管理不能になるため、これまでのところ現実の問題の解決には限られた成果しかあげていません。

弱い AI は「狭義の AI」とも呼ばれ、ユーザーの入力に基づいて質問に答えたり、顔を認識したり、チェスをプレイしたりするなど、特定のタスクを実行することに重点を置いた AI に対するそれほど野心的なアプローチではありません。学習アルゴリズムのパラメータを定義し、正確性を確保するために関連するトレーニングデータを提供するには、人間の介入に依存します。

しかし、弱い AI では大きな進歩が遂げられており、よく知られた例としては、顔認識アルゴリズム、自然言語モデル (OpenAI の GPT-n など)、仮想アシスタント (Siri や Alexa など)、Google/DeepMind のチェスプログラム AlphaZero、そしてある程度は自動運転車などがあります。

弱い AI を実現するためのアプローチは、多くの場合、動物の脳を構成する生物学的ニューラルネットワークにヒントを得たシステムである人工ニューラルネットワークの使用を中心に展開されます。これらは相互接続されたノードまたはニューロンの集合であり、「入力層」に提示されたデータと相互接続の重みに基づいて出力を決定する活性化関数と組み合わされています。「出力」が有用または正確になるように相互接続の重みを調整するには、ネットワークを多数のデータ例にさらし、出力損失を「逆伝播」することで、ネットワークを「トレーニング」できます。

ニューラルネットワークとルールベース AI を組み合わせた「ニューロシンボリック AI」と呼ばれる 3 番目の分野が存在するとも言えます。生物学的脳の働きに近いと思われるため、概念的には有望でもっともらしいものの、まだ非常に初期段階にあります。

これは本当に規模の問題なのでしょうか?

現在の議論の鍵となるのは、十分な規模の AI と機械学習モデルがあれば、人工汎用知能 (AGI) を真に実現し、シンボリック人工知能を完全に排除できるかどうかです。現時点ではハードウェアのスケーリングと最適化の問題だけなのでしょうか、それとも AI アルゴリズムとモデルをさらに発見して開発する必要があるのでしょうか?

テスラも Google/DeepMind の見解を採用しているようです。テスラは2021年の人工知能（AI）デーのイベントで、テスラボット（別名オプティマス）の発売を発表した。これはテスラが自社の自動車に搭載されている先進運転支援システム用に開発したのと同じAIシステムによって制御される汎用ヒューマノイドロボットだ。興味深いことに、同社のCEOであるイーロン・マスク氏は、2023年までにロボットの生産を開始したいと述べており、オプティマス・プライムは最終的には「人間がやりたくないことなら何でも」できるようになると主張しており、その頃にはAGIが実現可能になると期待している。

しかし、他の AI 研究チーム、特に Meta の主任 AI 科学者でニューヨーク大学教授の Yann LeCun 氏は、人間レベルの人工知能 (HLAI) というそれほど野心的ではない用語を好み、純粋なコンピューティング能力では解決できない多くの問題がまだ残っており、新しいモデルやソフトウェアパラダイムが必要になる可能性があると考えています。

これらの問題の中で、機械は、赤ちゃんのような観察を通じて世界がどのように機能するかを理解し、その行動が世界にどのような影響を与えるかを予測し、世界の本質的な予測不可能性に対処し、一連の行動の影響を予測して推論し計画し、抽象的な空間で表現し予測する能力を持っています。最終的に議論となるのは、これが現在の人工ニューラルネットワークのみを使用した勾配ベースの学習によって達成できるかどうか、あるいはさらなるブレークスルーが必要なのかどうかです。

ディープラーニングモデルは人間の介入なしにデータから「主要な特徴」を生成できるというのは事実ですが、より多くのデータと計算能力があれば、残りの問題にも取り組んで解決できると信じたくなりますが、これはあまりにも出来すぎた話かもしれません。単純な例えで言えば、より速く、よりパワフルな車を設計し、製造しても、その車が飛ぶようになるわけではありません。なぜなら、そもそも飛行の問題を解決するには、空気力学を完全に理解する必要があるからです。

ディープラーニング AI モデルの使用による進歩は目覚ましいものですが、弱い AI 実践者の楽観的な見方が、単にマズローのハンマーの例なのか、あるいは「持っている道具がハンマーだけであれば、あらゆる問題を釘として見てしまう傾向がある」という「道具の法則」なのかを考える価値はあります。

ゲームオーバーか、協力か？

Google/DeepMind、Meta、Tesla のような基礎研究は、多額の予算があるにもかかわらず、学術的な協力や長期的な思考よりも競争や市場投入のスピードを優先する組織が多いため、民間企業を不安にさせることが多い。

汎用人工知能の問題を解決するには、強力な AI 支持者と弱い AI 支持者との競争ではなく、2 つのアプローチが必要になる可能性があります。人間の脳は意識的にも無意識的にも学習する能力を持っているため、人間の脳との類似性は不自然なものではありません。小脳は脳の容積の約 10% を占めますが、ニューロンの総数の 50% 以上を占め、特に手足の運動技能に関連する調整と動作、および姿勢とバランスの維持を担っています。これは素早く無意識に行われたもので、どうやって行ったのかは正確には説明できません。しかし、私たちの意識的な脳は、はるかに遅いとはいえ、抽象的な概念、計画、予測を処理する能力を持っています。さらに、意識的に知識を獲得し、トレーニングと反復を通じて自動性を獲得することも可能です。これはプロのアスリートが得意とするところです。

自然が人間の脳を数十万年かけてこのようにハイブリッドな形で進化させたのなら、なぜ一般的な AI システムが単一のモデルやアルゴリズムに依存しているのか疑問に思わざるを得ません。

社会と投資家への影響

最終的に AGI を実現する具体的な AI 技術が何であれ、この出来事は車輪、蒸気機関、電気、コンピューターと同じように私たちの社会に大きな影響を与えるでしょう。おそらく、企業が人間の労働をロボットで完全に置き換えることができれば、資本主義の経済モデルを変える必要があり、そうしないと最終的には社会不安が生じることになるだろう。

そうは言っても、現在進行中の議論は企業の広報のようなもので、汎用人工知能は実際には現在私たちが考えているよりも遠い将来に実現する可能性が高いため、その潜在的な影響について検討する時間はまだあると考えられます。しかし、短期的には、汎用 AI の追求がソフトウェアや半導体などの特定の技術分野への投資を促進し続けることは明らかです。

弱い AI フレームワーク内での特定のユースケースの成功により、既存のハードウェア機能に対する圧力が高まっています。たとえば、OpenAIが2020年にリリースした人気の高いGenerative Pre-Trained Transformer 3（GPT-3）モデルは、すでに人間レベルの流暢さでオリジナルの散文を書く能力を備えており、1,750億のパラメータを持ち、トレーニングには数か月かかります。

CPU、GPU、FPGA など、現在存在する半導体製品の中には、ディープラーニングアルゴリズムを多かれ少なかれ効率的に計算できるものがあると言えます。しかし、モデルのサイズが大きくなるにつれて、パフォーマンスが不十分になり、AI ワークロードに最適化されたカスタム設計の必要性が生じます。 Amazon、Alibaba、Baidu、Google などの大手クラウドサービスプロバイダー、Tesla、Cambricon、Cerebras、Esperanto、Graphcore、Groq、Mythic、Sambanova などのさまざまな半導体スタートアップも、この方法を採用しています。

<<: コンピュータビジョンがビジネス課題の解決に役立つ 5 つの方法

>>: AIが新たな成長エンジンに。アマゾンウェブサービスの技術的手法に耳を傾けてみよう