なぜビッグデータは十分にスマートではないのでしょうか?機械が強力な人工知能へと進化する方法

なぜビッグデータは十分にスマートではないのでしょうか?機械が強力な人工知能へと進化する方法

なぜビッグデータは十分にスマートではないのでしょうか?確率の言語よりも強力な思考ツールは何でしょうか? SF映画に登場する強力な人工知能をどうやって実現できるのでしょうか?インテリジェントな機械を人間のように考えさせるにはどうすればよいでしょうか?因果関係を明らかにすることによってのみ、光が見えてきます。

これらの疑問に対する答えは、チューリング賞受賞者であり「ベイジアンネットワークの父」であるジューディア・パールによる大ヒット作品「なぜ:因果関係の新しい科学」で紹介されています。

[[278943]]

人工知能の分野におけるほとんどの問題は意思決定の問題です。 1939 年、統計学者のエイブラハム・ワードは、パラメータ推定と仮説検定はどちらも統計的意思決定の問題であると指摘する記事を書き、統計全体を統計的意思決定理論の枠組みに組み込むことを計画しました。損失関数は統計的意思決定の出発点です。損失関数が与えられれば、ベイズ法は観測データの有無にかかわらず、常に最小の期待損失を伴う決定を選択します。頻度主義者は、事前に決定ルールを策定し、損失関数とサンプルに基づいてリスク関数を定義し、特定の原則(最大および最小原則、ベイズリスク原則など)に基づいて最適な決定を選択する必要があります。

決定が受動的に受け入れられた観察データに基づいている場合、それは因果関係の階段の最初のレベルにあり、観察データに大きく依存しているため、必然的に偏りが生じます。第 2 レベルの武器である介入により、観察サンプルに制約されることなく決定を下すことができ、一部のサンプルでは反映できない事実が明らかになります。つまり、第 2 レベルに到達した AI は、原因と結果を分析するためのアクションを積極的に実行する能力を備え、意思決定行動がよりインテリジェントになります。

反事実的推論の第 3 レベルにより、機械は「想像能力」を持つことができます。反事実的推論では、直接的な観察データからは推論できず、因果モデルに頼らなければならない仮想の世界を考慮します。

因果関係の階段

今日に至るまで、ディープラーニングは AI における注目の手法であり、盲目的に AI と同一視する人もいます。実際、機械学習の手法は無数にあり、ディープラーニングはほんの一滴に過ぎません。理論的には、たとえ人工知能が因果関係の階段の最低レベルで完璧を達成したとしても、反事実の世界に入るどころか、介入レベルに飛躍することはできないことが証明できます。

因果関係の階段の最下層に位置する機械学習技術として、ビッグデータ分析は多変量統計分析であり、ディープラーニングは単なる隠れ層を増やしたニューラルネットワークであり、理論的にはそれほど新しいものではありません。パール教授は、ビッグデータ分析とディープラーニング(そしてほとんどの従来の機械学習も)は、研究対象が因果関係ではなく相関関係であるため、因果関係の階段の第一レベルにあると考えています。

パール氏は、因果関係の階段の最も低いレベルにある相関分析を軽視しているのではなく、単に現状に満足せず、さらに高みを目指し続けるよう私たちに思い出させているだけなのです。異なるレベル間でも協力関係を築くことができます。例えば、実際には、深層学習を強化学習の戦略に適合させるために使用することができます。この2つを組み合わせると「深層強化学習」となり、かつてはAlphaGoのコア技術の1つでした。

周知のとおり、今回の AI 爆発はコンピューティング能力の向上から大きな恩恵を受けています。たとえば、ディープラーニングはコンピューティング能力の助けを借りた人工ニューラルネットワークの「復活」であり、データ駆動型手法を頂点に押し上げています。人々は、「すべての科学的な疑問に対する答えはデータの中に隠されており、巧妙なデータマイニング技術によって明らかにされるのを待っている」という幻想さえ抱いている。パール教授はこうした考え方を批判し、因果モデルをより高い位置に置き、数学的または統計的モデリングの栄光を各分野の専門家に返しました。将来、機械学習が成功するために錬金術師の幸運に頼らなくなることを願っています。知識推論と計算がさらに注目されるようになると、説明可能な AI は因果関係の新しい科学からより多くの力を引き出し、反事実の世界にも進出するでしょう。

DeepMindが開発したAlphaGo囲碁プログラムは、2016年に初めて人間のトップ囲碁プレイヤーであるイ・セドルを破り、翌年にはすべての人間の名人を圧倒しました(柯潔に対する3-0の勝利を含む)。聶衛平(9段)は、そのレベルを「少なくとも20段」と評した。 AlphaGo は深層強化学習とモンテカルロ木探索を採用しており、最終バージョンの AlphaGo Zero は、李世ドルを倒せるレベルまで自己トレーニングするのにわずか 3 日しかかかりませんでした。 2017年、DeepMindはAlphaGoが「引退」し、今後は囲碁の大会には参加しないと発表した。

[[278944]]

ボードゲームの中でも、囲碁に含まれる膨大な探索空間(その状態の数は全宇宙の原子の数をはるかに超える)は、機械学習では克服できない難問であり、近い将来にAIが解決するのは不可能だとさえ考えられていた。 AlphaGo の成功により、強化学習と確率的シミュレーション技術 (「モンテカルロ」技術とも呼ばれる) の魅力が人々に認識されるようになっただけでなく、ディープラーニングの人気も高まりました。冷静になってみると、AlphaGo のアルゴリズムは大規模な確率空間でのインテリジェントな検索に適しており、環境と状態はどちらもシミュレーション可能であることが分かりました。ディープマインド社の創設者デミス・ハサビス氏は、こうしたアルゴリズムは、自動運転など、環境をシミュレートすることが難しい意思決定の問題には無力だと述べた。パール氏は「Why」の第10章でもAlphaGoについて語り、説明可能性の欠如がAlphaGoの欠点であると信じていました。

強化学習を例に挙げてみましょう。強化学習は、教師あり学習や教師なし学習とは異なり、マルコフ決定過程に基づいて開発された第 3 のタイプの機械学習方法です。インテリジェント エージェントは、環境と相互作用することで、ますます「スマート」になります。強化学習と因果推論はどちらも、アクションが因果的に関連するポリシーを求めますが、因果推論はよりオープンエンドであり、データを超えた知識を使用してポリシーの効果を推論できます。強化学習により介入の結果を推測できるようになり、因果関係の階段の 2 番目の段を登ることができます。強化学習では、環境をシミュレートすることで、モデルをトレーニングするために現実世界から観測データを取得する必要がなくなり、反事実を生成して因果関係のラダーの第 3 レベルに到達することも可能です。現在の強化学習では事前知識がほとんど使用されませんが、強化学習と因果推論の理論的なつながりについては依然として興味があります。

人工知能の今後の発展も「総合的」な傾向にあるだろう。例えば、音声、画像、動画データなどはすべてテキストに変換でき、AI技術によってデータに対する理解を深めることができます。同時に、AI テクノロジー (因果推論を含む) を使用してデータをより深く理解することで、モデルのトレーニングやアプリケーションの結果の向上にも役立ちます。同様に、因果理論と機械学習などの既存の AI テクノロジーが相互に利益をもたらすために連携することは可能でしょうか?たとえば、因果推論で考慮する変数が多くなるほど、計算上の課題は大きくなります。その場合、モンテカルロ法に基づく近似計算が役立つでしょうか?機械学習は因果モデリングを支援し、改善することができますか?これらの問題についてはさらなる研究が必要です。

形式化された因果関係の理論は、長年統計学者を悩ませてきたいくつかのパラドックスを解決するだけでなく、より重要な点として、(1)「介入」を利用して人間と機械を受動的な観察から解放し、代わりに因果関係を能動的に探究してより良い決定を下せるようにし、(2)「反事実的推論」を利用して想像の余地を広げ、現実世界の制約から解放するという点があります。これら 2 つのブレークスルーは因果革命を達成し、因果の階段のそれぞれ第 2 レベルと第 3 レベルの内容を構成します。因果律の階段をたどることで、機械は強力な人工知能を実現できると期待されます。

<<:  AIの新興企業が胡潤富豪リストに名を連ねる:「CVの4人の小さなドラゴン」の創業者3人がリスト入り

>>:  グラフィカル分散コンセンサスアルゴリズム

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能が未来の学校を再構築し、教育問題の解決に貢献

スティーブ・ジョブズはかつて、世間では「スティーブ・ジョブズの質問」と呼ばれている、と発言しました。...

Keras の創設者: ディープラーニング関連の仕事は過去 6 か月で減少

[[340767]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

人工知能が電力網の未来の鍵となる理由

[[201461]] 2016年の英国の電力構成は過去60年間で最もクリーンとなり、主に風力と太陽光...

機械学習の7つの大罪

機械学習実験の信頼性を損なう7つのよくある間違い[[328516]]機械学習は私たちの世界を変える素...

IDCレポート:ジェネレーティブAIは爆発的な産業探査の時代に入り、技術供給側は商業化の初期段階にある

9月22日、IDCコンサルティングの公式WeChatアカウントによると、2023年下半期以降、ますま...

テクノロジーから製品まで、Apple Siriのディープラーニング音声合成技術の秘密が明らかに

[[201603]] Siri は、音声合成技術を使用して人間とコミュニケーションをとるパーソナルア...

クラウドベースの SaaS アプリケーションで AI を活用して効率的なリモート ワークを実現する方法

現在進行中のCOVID-19パンデミックにより、企業がリモートワークを実施する必要性が浮き彫りになり...

機械学習が自閉症の「非コード変異」の秘密を解明

新たな研究によると、遺伝子間の自然発生的な突然変異は、生まれつきの遺伝子と同じくらい自閉症において重...

大規模ウェブサイトのアルゴリズムとアーキテクチャに関する簡単な説明

順序先月、上司が「大規模ウェブサイトのアルゴリズムとアーキテクチャに関する簡単な説明」という講義をし...

分散トレーニング入門: PyTorch を使用してマルチ GPU 分散トレーニングを実装する方法

具体的には、この記事ではまず、分散コンピューティングの基本概念と、分散コンピューティングがディープラ...

研究によると、ChatGPT は科学的仮説の偽のデータセットを生成し、学術的誠実性に脅威を与える可能性がある。

ネイチャー誌は11月24日、現地時間水曜日に、今月初めに米国医師会眼科学会誌に掲載された論文で、著者...

...

事例 | 人工知能はヘルスケアの未来をどう変えるのか?

人工知能はこれらすべてを変え、私たちにとって物事をより簡単にしてくれます。 それは、私たちが交流し、...

5GとエッジAI: トラフィック管理問題の解決

通勤方法は時代とともに変化してきたかもしれませんが、交通管理の方法は変わっていません。 INRIX世...

企業がAI対応データベースを使用してAI導入を加速する方法

企業は、AI を搭載し、AI 向けに構築されたデータベースを検討する必要があります。最適化と使いやす...