DeepMind の最新研究: AI が人間に勝ち、より優れた経済メカニズムを設計 | Nature サブジャーナル

人工知能（AI）は人類社会を真に知的な時代へと導くことができるのでしょうか？

人工知能産業は60年以上の発展を経て飛躍的な進歩を遂げ、経済や社会のあらゆる側面で広く活用されるようになりましたが、人間の価値観と一致する人工知能システムの構築は未解決の問題として残っています。

現在、英国の人工知能企業DeepMindによる新たな研究は、人工知能業界の専門家にこの課題を解決するための新たなアイデアを提供するかもしれない。

ディープマインドの人工知能システムは、4,000人以上からの学習とコンピューターシミュレーションを通じて、4人プレイのオンライン経済ゲームで公的資金をどのように再配分するかという政策立案を学んだだけでなく、非常に優れたパフォーマンスを発揮し、他の人間のプレイヤーに勝利したと報告されている。

このゲームでは、プレイヤーは寄付金をそのまま受け取るか、集団の利益のために他の人と分けるかを決定します。

「民主的なAIによる人間中心のメカニズム設計」と題された関連研究論文が、権威ある科学誌「ネイチャー・ヒューマン・ビヘイビア」に7月5日にオンライン掲載された。

出典: Nature Human Behaviour

英国ヨーク大学のアネット・ツィンマーマン助教授は、「民主主義を、最も人気のある政策を求める『選好満足』システムと狭義に同一視すること」に対して警告した。

彼女はまた、民主主義とは単に自分たちの好きな政策を最もうまく実施することではなく、国民が平等に関わり合い、議論できるプロセスを作り出すことだとも述べた。

AIが設計した経済の仕組み

AI 研究の究極の目標は、日常的な作業の支援から社会が直面している大きな実存的課題の解決まで、人類に利益をもたらすテクノロジーを構築することです。

現在、機械学習システムはすでにバイオメディカルにおける主要な問題を解決し、人類が環境問題に取り組むのに役立っています。しかし、人間が公正で繁栄した社会を設計するのを支援するための AI の応用は、まだ開発されていません。

経済学とゲーム理論において、メカニズム設計と呼ばれる分野では、望ましい目標を達成するために、インセンティブを与えられた行為者の間で富、情報、権力の流れを最適に制御する方法を研究します。

この研究で、研究チームは、深層強化学習 (RL) エージェントを使用して、インセンティブを与えられた人々の好みを捉える経済メカニズムを設計できることを証明しようとしました。

このゲームでは、プレイヤーはそれぞれ異なる金額からスタートし、共通の資金プールをより良く発展させるためにいくら寄付するかを決め、最終的に見返りとして一部を受け取る必要があります。これには、寄付金をそのままにするか、潜在的な集団的利益のために他のプレイヤーと共有するかを繰り返し決定することが含まれます。

研究チームは、富の平等と不平等の状況においてプレイヤー間で資金を分配する再分配メカニズムを設計するために、深層強化学習エージェントを訓練しました。

共有収益は、AI システムによって設計されたものと人間によって設計されたものの 2 つの異なる再分配メカニズムを通じてプレイヤーに返還されます。

図｜ゲームデザイン（出典： Nature Human Behaviour ）

人工知能によって策定された政策では、各プレイヤーが拠出した初期資金の額に基づいて公的資金が再分配され、プレイヤー間の富の格差が縮小される。

このポリシーは、「平等主義」アプローチ（各プレイヤーの拠出額に関係なく資金を均等に分割する）や「リベラル」アプローチ（各プレイヤーが拠出した国庫の割合に基づいて資金を分割する）よりも、人間のプレイヤーから多くの票を獲得しました。

同時に、このポリシーは初期の富の不均衡を是正し、プレイヤーが開始資本の約半分を拠出しないとほとんど報酬を受け取れないため、プレイヤーの「フリーライド」を阻止します。

しかし、研究チームは、研究結果が「AI政府」の処方箋を示すものではなく、政策立案に特化したAI駆動型ツールを構築するつもりもないと警告した。

それは信頼できるでしょうか?

この研究結果は、人間が明らかに好むインセンティブ適合型経済ゲームのメカニズムを設計することで、AI システムを民主的な目標を達成するように訓練できることを示唆している。

この研究では、研究チームは人工知能技術を使用して、再分配スキームをゼロから学習しました。このアプローチにより、AI 研究者自身が偏見を持っていたり、より広範な人口を代表していない可能性があったりする AI 研究者が、最適化するドメイン固有の目標を選択する負担から解放されます。

この研究作業では、理論的に挑戦的な問題も含め、いくつかの疑問も生じています。たとえば、価値調整の方法として民主主義の目標を強調するのは良い考えであるかどうかという疑問が生じるかもしれません。 AI システムは、少数派を犠牲にして多数派に力を与えるという他の民主的なアプローチの傾向を受け継いでいる可能性があります。 AI が社会の既存の偏見、差別、不平等を悪化させるような形で導入される可能性があるという差し迫った懸念を考えると、これは特に重要です。

出典: Pixabay

もう一つの未解決の問題は、AI システムに設計されたメカニズムを人々が信頼するかどうかだ。審判員の身元が事前にわかっている場合、プレイヤーは AI エージェントよりも人間の審判員を好む可能性があります。しかし、タスクが人間にとって複雑すぎると思われる場合、人々は AI システムを信頼する傾向があります。

さらに、経験を通じて学ぶのではなく、口頭でメカニズムを説明された場合、プレイヤーの反応は異なるでしょうか?膨大な文献から、メカニズムが「経験的」ではなく「記述的」である場合、特にリスクのある選択に関しては、人々は異なる行動をとることがあることがわかっています。しかし、AI によって設計されたメカニズムは必ずしも言葉で表現できるとは限らず、その場合、観察される動作は研究チームが採用した説明の選択に完全に依存していると思われます。

研究チームは論文の最後で、この研究結果が、人間の介入なしに自律的なエージェントが政策決定を行う「AIガバナンス」の一形態を支持するとも強調した。

彼らは、この方法をさらに開発することで、現実世界の問題を真に人間的な方法で解決するのに役立つツールが提供されることを期待しています。

<<: 時間はお金だというのは本当です！この日本人男性は9日間で5千円を費やして「タイムマシン」を作ったが、1分巻き戻すのにかかる費用はたった1円だ。

>>: シンガポール国立大学と清華大学は、決定木向けに特別に設計され、高速かつ安全な新しい連合学習システムを共同で提案した。