史上初! Google AI プレイヤーが StarCraft II で人間に勝利

史上初! Google AI プレイヤーが StarCraft II で人間に勝利

[[256388]]

この試合はイギリス・ロンドンにあるDeepMind本社からライブ配信された。

GoogleのDeepMindが開発した人工知能ソフトウェアプレイヤーが、ゲーム「スタークラフトII」で人間のプレイヤーに勝利した。これは人工知能としては初めてのことだ。

YouTube と Twitch で放送された一連のゲーム マッチで、AI プレイヤーが人間のプレイヤーを 10 回連続で破りました。決勝戦では、プロゲーマーのGrzegorz "MaNa" Kominczが人類に勝利をもたらしました。

ディープマインド研究部長のデビッド・シルバー氏は、大会後に次のように語った。「さまざまなゲーム大会でAIが達成した結果は、人工知能の発展における重要なマイルストーンです。まだやるべきことはありますが、未来の人々が今日を振り返り、これがAIシステムの潜在能力におけるもう一つの重要な前進であると認識してくれることを願っています。」

ビデオゲームで人間に勝つことは、人工知能の開発における副次的なことのように思えるかもしれないが、実際には大きな研究課題である。 StarCraft II のようなゲームは、チェスや囲碁のようなボードゲームよりもはるかに難しいです。ビデオゲームでは、AI ソフトウェア エンティティは各駒の動きを観察して次の動きを計算することはできず、リアルタイムで反応する必要があります。

[[256389]]

昨年 12 月の AlphaStar 対 TLO のスクリーンショット。

これらの要因は、DeepMind の人工知能ゲームプレイ システム (AlphaStar) にとって大きな障害にはならないようです。まず、プロプレイヤーの Dario "TLO" Wünsch を破り、その後 Komintz に挑戦しました。この一連の試合はもともと昨年12月にDeepMindのロンドン本社で行われたが、Komintzとの決勝戦が本日ライブ配信され、プロゲーマーが人類に勝利をもたらした。

プロのスタークラフト解説者は、アルファスターのパフォーマンスを「並外れた」かつ「超人的」と評した。

StarCraft II では、同じマップ上のさまざまな場所からスタートし、基地を建設し、軍隊を訓練し、敵の領土に侵攻します。 AlphaStar は、戦場で部隊を迅速かつ決定的に制御する能力、いわゆるマイクロマネジメントに特に優れています。

人間のプレイヤーはより強力な軍隊を訓練できることもありましたが、AlphaZero は接近戦では人間に勝つことができました。あるゲームでは、AlphaStar は動きの速い「ストーカー」を使ってマナを集めました。解説者のケビン・「ロッテルダム」・ファン・デル・キュー氏は、この試合を「通常では見られないレベルの、並外れた部隊統制」の達成と評した。

「もし私が人間の相手と対戦していたら、このレベルでストーカーを細かく管理することはできないだろう」とコミンツは試合後に語った。

この事件は、他の高度な AI ゲーム プレイヤーに見られた行動と一致しています。

昨年、OpenAI の AI プレイヤーが Dota 2 トーナメントに出場した際、最終的に人間のプレイヤーに敗れました。しかし、業界の専門家は当時、AIソフトウェアプレーヤーは優れた明瞭性と正確性を示し、迅速かつ正確な判断を下すことができ、これも人工知能プレーヤーの利点であるとコメントしました。

専門家たちはゲームを分析し、アルファスターが不当な優位性を得たかどうかについて議論し始めた。 AI プレーヤー (ソフトウェア エンティティ) のパフォーマンスは、いくつかの面で劣っています。たとえば、AI プレーヤーが実行できる 1 分あたりのクリック数は制限されています。ただし、人間のプレイヤーとは異なり、手動で移動するのではなく、マップ全体を一度に表示できます。

DeepMindの研究者らは、AIプレイヤーは一度にマップの一部にしか焦点を当てていなかったため、実際には実質的な優位性を獲得していなかったと述べた。しかし、ゲームプレイが示すように、これによって AlphaStar が 3 つの異なるエリアで同時に巧みに部隊を制御することが阻止されることはありません。解説者は、これは人間のプレイヤーには不可能だと述べた。注目すべきは、Komintz がライブ マッチで AlphaStar に勝ったとき、AI が制限されたカメラ ビュー モードを使用していたことです。

また、この人工知能プレイヤーとの決闘の相手はプロのプレイヤーではあるが、世界チャンピオンレベルではないことも指摘しておくべきだろう。 TLO コンテストに参加するプレイヤーは、自分がよく知らない StarCraft II のゲームもクリアする必要があります。

AlphaStar のゲーム処理を示すグラフィック。システムはマップ全体を上から下まで見て、どのアクションが勝利につながるかを予測します。

その議論はさておき、専門家たちはこのコンテストは人工知能にとって大きな前進だと述べている。スタークラフトのAIシーンに長年関わってきた研究者デイブ・チャーチル氏は、イギリスの新聞ガーディアン紙に次のように語った。「AIゲームソフトウェア企業が実証した能力は大きな成果であり、AI研究者の間で私が聞いた最も楽観的な推測よりも少なくとも1年は進んでいると思う。」

しかし、チャーチル氏は、ディープマインドがこの研究についてまだ研究論文を発表していないため、アルファスターが技術的な飛躍を達成したかどうかを判断するのは難しいと付け加えた。 「私はブログ記事を読んでいないし、判断を下すための文書や技術的な詳細も見ていない」とチャーチル氏は述べた。

ジョージア工科大学の人工知能准教授マーク・リードル氏は、このゲームの結果には驚いておらず、人工知能が人間のプレイヤーに勝つのは「時間の問題」だと語った。

リーデル氏は、この試合はスタークラフト II が AI プレイヤーによって本当に征服されたことを示したものではないと付け加えた。同氏は、過去のライブゲームでは、AlphaStar はウィンドウに制限されていたため、AI の利点の一部が失われていたが、「しかし、私たちが見ているより大きな問題は、AI が学習した戦略が脆弱であり、プロのプレイヤーが AI プレイヤーを快適な領域から押し出すと、AI が機能しなくなることです」と述べた。

実際、ビデオゲームで AI プレイヤーが人間に勝てるようにする最終的な目標は、AI のトレーニング方法を改善し、特に StarCraft のような複雑な仮想環境で動作できる AI システムを作成することです。

AlphaStar をトレーニングするために、DeepMind の研究者は強化学習と呼ばれる手法を使用しました。 AI ソフトウェア エンティティは基本的に、何らかの目標 (勝利や単に生き残ることなど) を達成するために試行錯誤しながらこのゲームをプレイします。彼らはまず人間のプレイヤーを真似して学習し、その後は競争的なゲーム試合で互いから学びました。さまざまな AI ソフトウェア エンティティの中で、強いものが生き残り、弱いものが見捨てられます。 DeepMind は、各 AlphaStar ソフトウェア インスタンスがこのようにして約 200 年のプレイ時間を蓄積していると推定しており、プレイが蓄積されるにつれて、ゲームのプレイ速度はますます速くなります。

DeepMind はこの作業を実行する目的を明確にしています。 「ディープマインドの使命は、何よりもまず、汎用AIシステムを構築することだ」と、アルファスター・プロジェクトを率いたオリオール・ヴィニャルズ氏は述べ、人間が行えるあらゆる知的作業を実行できるAIソフトウェアの構築に言及した。 「これを実現するには、さまざまなタスクにわたって AI ソフトウェア エンティティのパフォーマンスをベンチマークして比較することが重要です。」

<<:  ガートナー:2021年までに70%の組織が従業員の生産性向上にAIを活用する

>>:  2019年のテクノロジートレンド予測: 5Gが爆発的に普及し、人工知能も勢いを増す

推薦する

成功するAIチームの特徴

今日の時代では、人々は目標を達成するために人工知能 (AI) にますます依存するようになっています。...

AI探偵が事件を解決する3つの秘策

[[241150]]画像出典: Visual China今年のコナン映画は中国でも公開されるそうです...

...

GPT-4 ワイルドスポークスマン Terence Tao: 新しい文学ツールは、それがなければ崩壊してしまいます! 11ページの「超短編」新作がオンラインになりました

テレンス・タオはGPT-4をどれくらい愛しているのでしょうか?今回、論文を書いたり研究をするときだけ...

機械学習はバッテリー寿命を予測するのに役立ちます。バッテリーを何回充電できるかを正確に把握できます。

バッテリー寿命の決定は、モバイルハードウェアの開発において重要な部分です。しかし、バッテリーの電気化...

OpenAIの共同創設者Karpathyがアルパカに恋をする: 赤ちゃんLlama2を実装する純粋なCコード、MacBookが動作可能、1.6kの星を獲得

今週、Meta のオープンソース Llama2 が AI コミュニティ全体で人気を博しました。その結...

大規模グラフニューラルネットワークの応用と最新のパラダイムの探究

1. 大規模グラフメモリ/計算問題を解決するための3つのパラダイム2年前に作成したチュートリアルでは...

ケンブリッジ大学チームは約50年後に初めて量子スピン液体を検出し、その研究はサイエンス誌に掲載された。

[[439547]]一部の研究者は、量子コンピューターがいつの日かデジタル暗号の解読や薬剤の設計な...

MITとワトソン研究所のチームが、ジェスチャーを見るだけで音楽を完璧に再現する最新のAIを発表

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Google がディープラーニング ライブラリ TensorFlow Fold をリリース、動的計算グラフをサポート

ほとんどの機械学習プロセスでは、トレーニングと推論に使用するデータを前処理する必要があります。前処理...

2020 年の予測: 今年はサイバー犯罪サービスが普及する年になるか?

業界メディアeWEEKの2020年の予測:人工知能と機械学習の「中毒」についての予測も見られ、これが...

...

新しいAIプログラミング言語はディープラーニングを超える

MIT の研究者チームは、人工知能の分野を初心者にとってよりアクセスしやすいものにするとともに、専門...

ザッカーバーグの45分間の詳細なインタビュー:今後10年間のVRと脳コンピューターインターフェースへの野望を明らかにする

[[386531]]誰もそこに頭を突っ込みたくないよ!ザッカーバーグ氏は脳コンピューターインターフェ...