シンボリック人工知能、シンボリックAIの利点と限界について学びます

シンボリック人工知能、シンボリックAIの利点と限界について学びます

現在、AI は主に人工ニューラル ネットワークとディープラーニングに関するものです。しかし、必ずしもそうとは限りません。実際、過去 10 年間の大部分において、この分野は「古典的 AI」、「ルールベース AI」、「旧式 AI」とも呼ばれるシンボリック人工知能によって支配されてきました。

[[328884]]

シンボリック AI では、人間の知識と行動ルールをコンピューター プログラムに明示的に埋め込みます。 AI 研究の初期の数十年間では、この実践は大きな期待が寄せられていました。しかし近年、ニューラル ネットワーク (コネクショニスト AI とも呼ばれる) が広く注目を集めるようになり、シンボリック AI は徐々に廃止されつつあります。

人工知能におけるシンボルの役割

シンボルは他のものを表すために使用するものです。シンボルは人間の思考と推論において重要な役割を果たします。猫が木に登っているのを見たと言ったら、あなたの心にはすぐにそのイメージが浮かぶでしょう。

私たちは、物(猫、車、飛行機など)や人(教師、警官、販売員)を定義するために常にシンボルを使用しています。シンボルは抽象的な概念 (銀行取引) や存在しないもの (Web ページ、ブログ投稿など) を表すことができます。また、アクション (実行中) や状態 (非アクティブ) を説明することもできます。シンボルは階層的に編成できます (車はドア、窓、タイヤ、座席などで構成されています)。また、他のシンボル(毛皮の耳を持つ猫、赤いカーペットなど)を説明するためにも使用できます。記号を使ってコミュニケーションできることは、私たちを賢くする主な要素の 1 つです。したがって、シンボルは人工知能の作成においても重要な役割を果たします。

AI の初期の先駆者たちは、「学習のあらゆる側面や知能のその他の特徴は、原理的には非常に正確に記述できるため、それをシミュレートする機械を構築できる」と信じていました。こうして、シンボリック AI が注目され、研究プロジェクトの焦点となりました。科学者は記号を定義し操作するためのツールを開発します。

コンピュータ サイエンスで見られる概念やツールの多くは、こうした取り組みの結果です。シンボリック AI プログラムは、明示的な構造と動作ルールの作成に基づいています。シンボリック AI ツールの一例としては、オブジェクト指向プログラミングが挙げられます。 OOP 言語を使用すると、クラスを定義し、そのプロパティを指定し、それらを階層的に整理することができます。これらのクラスのインスタンス (オブジェクトと呼ばれる) を作成し、そのプロパティを操作することができます。クラス インスタンスは、関数、メソッド、またはプロシージャとも呼ばれるアクションを実行することもできます。各メソッドは、現在のオブジェクトや他のオブジェクトのプロパティを読み取って変更する可能性のある一連のルールベースの命令を実行します。

OOP を使用すると、さまざまなタスクを実行する広範囲で複雑なシンボリック AI プログラムを作成できます。

シンボリックAIの利点と限界

シンボリック人工知能は、AI とコンピューティングの黎明期に初期の進歩を示しました。ルールベースのプログラムのロジックを簡単に視覚化し、伝達し、トラブルシューティングすることができます。

シンボリック AI は、ルールが非常に明確で、入力を簡単に取得してシンボルに変換できる設定に非常に便利です。実際、ルールベースのシステムは、ディープラーニング アプリケーションの作成に使用されるものも含め、今日のほとんどのコンピュータ プログラムのコストを占めています。

しかし、世界の混乱に対処しなければならないとき、シンボリック AI は機能不全に陥り始めます。たとえば、コンピューターが画像やビデオの内容を理解できるようにする科学であるコンピューター ビジョンを考えてみましょう。猫の写真があり、猫が写っている画像を検出するプログラムを作成したいとします。新しい画像を入力として受け取り、ピクセルを元の猫の画像と比較し、これらの画像に猫がいるかどうかを応答するルールベースのプログラムを作成します。

この方法は、元の画像の正確なコピーをプログラムに提供した場合にのみ機能します。猫の写真が少し違うと、否定的な答えが出ます。たとえば、猫の写真を別の角度から撮影すると、プログラムは失敗します。

解決策の 1 つは、さまざまな角度から猫の写真を撮り、各入力をこれらの画像すべてと比較するための新しいルールをアプリケーションに作成することです。たとえ猫の写真を何百万枚も撮ったとしても、起こり得るすべてのシナリオを考慮することはできないでしょう。照明条件や画像の背景が変化すると、ピクセル値が変わり、プログラムが失敗する原因になります。他にも何百万もの写真やルールが必要になります。

あらゆる猫を検出できるプログラムを作成したい場合はどうすればよいでしょうか? これを実現するには、いくつのルールを作成する必要がありますか?

猫の例は馬鹿げているように聞こえるかもしれませんが、これらはシンボリック AI プログラムが常に苦労している種類の問題です。現実世界に存在する乱雑なデータに対してルールを定義することはできません。たとえば、自動運転車が遭遇する可能性のあるさまざまな歩行者をすべて検出するためのルールをどのように定義するのでしょうか?

さらに、音声認識や自然言語処理など、一部のタスクは直接的なルールに変換できません。

特定のドメインに関する多数のルールを含む複雑なシンボリック AI システムを作成する取り組みがいくつか行われてきました。エキスパート システムと呼ばれるこれらのシンボリック AI モデルは、ハードコードされた知識とルールを使用して、医療診断などの複雑なタスクを処理します。しかし、それらはドメイン専門家やソフトウェア エンジニアによる多大な労力を必要とし、非常に限られたユース ケースでのみ機能します。問題を一般化すると、追加する新しいルールが多数発生し (猫検出問題を覚えていますか?)、より多くの手作業が必要になります。一部の AI 科学者が指摘しているように、シンボリック AI システムは拡張できません。

ニューラルネットワークとシンボリックAI

ニューラル ネットワークはシンボリック AI とほぼ同じくらい古いものですが、非効率であり、当時は利用できなかったコンピューティング リソースを必要としたため、ほとんど使われなくなってしまいました。過去 10 年間で、ディープラーニングは、膨大なデータと処理能力の可用性により人気が高まり、シンボリック AI システムを上回りました。

ニューラル ネットワークの強みは、乱雑で構造化されていないデータを処理できることです。猫検出器を例に挙げてみましょう。猫のピクセルを検出するためのルールを手作業で作成する代わりに、多数の猫の写真に対してディープラーニング アルゴリズムを手動でトレーニングすることができます。次に、ニューラル ネットワークは猫の画像の統計モデルを構築します。新しい画像を入力すると、その画像に猫が含まれている確率が返されます。

ディープラーニングとニューラル ネットワークは、シンボリック AI が苦手とするタスクに優れています。顔認識やがん検出などのコンピュータービジョンアプリケーションに革命をもたらしました。ディープラーニングは言語関連のタスクの開発も進歩させました。

ディープ ニューラル ネットワークは、複数の試行錯誤を通じて動作を開発する AI モデルである強化学習にも適しています。この AI は、囲碁、StarCraft、Dota などの複雑なゲームをマスターできます。

しかし、ディープラーニングとニューラルネットワークの利点はトレードオフなしには得られません。ディープラーニングには、シンボリック AI と比較して、多くの重大な課題と欠点があります。特に、ディープラーニングのアルゴリズムは不透明であり、その仕組みを理解することは作成者にとっても困難です。そして、彼らの内部の仕組みについてコミュニケーションをとり、問題を解決するのは困難です。

ニューラル ネットワークも大量のデータを消費します。シンボリック AI とは異なり、ニューラル ネットワークには、シンボルや知識の階層的表現の概念がありません。この制限により、科学や高校の数学など、論理と推論を必要とするタスクにニューラル ネットワークを適用することが困難になります。

シンボリックAIの現状

シンボリック AI は死んだと考える人もいます。しかし、この仮定は真実からかけ離れています。実際、ルールベースの AI システムは、今日のアプリケーションでも依然として非常に重要です。多くの一流の科学者は、記号的推論が今後も人工知能の重要な要素であり続けると信じています。

現在、ニューラル ネットワークとシンボリック AI を組み合わせる取り組みがいくつかあります。そのようなプロジェクトの 1 つが、MIT-IBM Watson AI Lab が開発したハイブリッド AI システムである Neural Symbolic Concept Learner (NSCL) です。 NSCL は、ルールベースのプログラムとニューラル ネットワークを使用して視覚の問題を解決します。純粋なニューラル ネットワーク ベースのモデルとは対照的に、ハイブリッド AI はより少ないデータで新しいタスクを学習でき、説明可能です。シンボルのみを使用するモデルとは異なり、NSCL は画像の内容を分析する努力をしません。

おそらく将来、推論と学習の両方が可能な AI テクノロジーが発明されるでしょう。しかし現在、論理的思考と知識表現を必要とする問題に対処するには、シンボリック AI が主流のアプローチとなっています。

<<:  パンデミックの期間中、AI の力を活用して顧客ロイヤルティを継続的に向上させるにはどうすればよいでしょうか?

>>:  検討すべき5つのスマートホームテクノロジー

ブログ    
ブログ    

推薦する

...

人間と機械の統合はなぜ難しいのでしょうか?

時間と空間を結びつけるのは速度であり、エネルギーと質量を結びつけるのも速度です。事実と価値を結びつけ...

GPT-4Vに挑戦する浙江大学の卒業生が、マルチモーダル大規模モデルのオープンソース版をリリースし、GitHubで6,000以上のスターを獲得しました。

GPT-4 の視覚機能がテスト用に完全にリリースされる前に、オープンソースのライバルが華々しくデビ...

Google PaLM モデルも素人によって覚醒したと宣言されましたか?業界関係者:Rational テストは GPT よりわずか 3% 優れている

「汎用人工知能」は、今や2020年代の「水から石油」の技術になりつつあります。ほぼ2週間ごとに、大規...

製造業における人工知能の活用事例トップ10

世界経済の礎である製造業は、人工知能 (AI) が推進する技術革命の最前線にあります。この記事では、...

2020年のサイバーセキュリティの転換点: 人工知能

先日終了したRSAC2020カンファレンスのテーマは「ヒューマンファクター」でした。業界では、この重...

究極の「公開」: GPT-4 モデルのアーキテクチャ、トレーニング コスト、データセット情報がすべて公開されます

GPT-4 のモデルアーキテクチャ、インフラストラクチャ、トレーニングデータセット、コストなどの情報...

世界の AI イベントのトップ 10 を見ると、AI ガバナンスはどのようにして利益を達成し、損害を回避できるのでしょうか?

はじめに:過去数年間を振り返ると、AIに関するネガティブな事件が頻繁に発生しており、政府は一連の政策...

NeurIPS 2023 レビュー: ビッグモデルが最も注目されており、清華大学 ToT 思考ツリーがリストに載る

最近、米国のトップ 10 テクノロジー ブログの 1 つである Latent Space が、終了し...

...

...

...

現在、人工知能技術はどのような分野に応用されていますか?

まず、人工知能プラットフォームの実装により、人工知能技術は多くの業界や分野、特にインターネットと密接...

ビッグビデオモデルは世界モデルですか? DeepMind/UC Berkeley Chinese: 次のフレームを予測することで世界を変えることができる

今年初めにOpenAIが発表した壮大な傑作「Sora」が、ビデオ関連分野のコンテンツエコロジーを変え...

テンセント・フンユアン・ビッグモデル・アップグレード:「文勝図」を追加し、コード能力を大幅に向上

テンセントは10月26日、テンセント渾源モデルが新たなアップグレードを経て、「文勝図」機能を正式に公...