ゲームの背後にあるAIストーリー:小規模サンプル学習と転移学習

ゲームの背後にあるAIストーリー:小規模サンプル学習と転移学習

2019年、人間と機械のゲームバトルにおいて、Open AI Fiveが圧倒的なパフォーマンスでDota2世界チャンピオンチームOGを破りました。

[[344878]]

ボードゲームは長い間、人間の知能と人工知能の最高峰の試金石と考えられてきました。

人工知能と人間のチェスプレイヤーの対決は絶え間なく続いています。三目並べ、碁盤、チェッカー、将棋、軍事将棋、国際将棋から、囲碁の最高レベルのゲームまで、コンピューターの人工知能プログラムは人間を打ち負かしてきました。

[[344879]]

人工知能の成果は目を見張るものがあります。少なくともゲームの分野では、完全に人間を圧倒しています。

しかし、この驚くべきパフォーマンスの背後には、人間の能力をはるかに超えたビッグデータ トレーニングの結果があります。Open AI Five のトレーニングを例にとり、その学習プロセスでどれだけのリソースが消費されるかを見てみましょう。

128,000 個の CPU;

256 P100;

数ヶ月のトレーニング…

[[344880]]

より理解しやすいデータに変換すると、ゲームプレイヤーが同じ結果を得るために 45,000 年間昼夜を問わずゲームを練習することに相当します。

現在の人間の寿命と思考能力を考えると、これは明らかに決して達成できない課題です。

これは現在人工知能業界、特にディープラーニングの分野が直面している最大の問題と課題の 1 つであり、主に次のものが含まれます。

データへの依存度が高い。

長期にわたる研究と訓練。

ソフトウェアとハ​​ードウェアのトレーニング コストが高額です...

それで、解決策は何でしょうか?

2020年に、学術界は因果関係の小サンプル学習という概念を提案しました。

小規模サンプル学習を実行するにはどうすればよいでしょうか?実際、この概念は、数年前に楊強教授(現WeBank最高人工知能責任者)と戴文元氏(現Fourth Paradigm CEO)が提唱した転移学習の概念と非常によく似ています。

小サンプル学習も転移学習も、人間を模倣し、人間がさまざまな知識を素早く学習する様子を見る学習と言えます。

ゲームをプレイすることを例に挙げてみましょう。

StarCraft ゲーム シリーズには、Terran、Protoss、Zerg の 3 つの種族と数十の軍事ユニットが含まれており、戦略から戦術まで何千もの異なるプレイ スタイルに進化できます。このゲームでは、最後の瞬間まで誰が勝つか負けるかを予想するのが難しいことがよくあります。そのため、人工知能を「育成」することに重点を置いたリアルタイム戦略バトルゲームにもなっています。

リアルタイム戦略ゲームが好きな人にとって、StarCraft シリーズのゲームをプレイできれば、Blizzard の Warcraft、DOTA2 シリーズ、Microsoft の Age of Empires シリーズなどの他のリアルタイム戦略ゲームも簡単に始めることができます。

同じタイプのゲームをプレイする際には、以前のゲーム体験を適用できるため、ゲームの背後にあるアイデアや方法は似ています。つまり、1 つの事例から推論を引き出し、それを別の事例に適用できるということです。

同様に、機械学習の場合、少数のサンプルを迅速に一般化するための鍵は、事前の知識(人間の経験に類似)を使用することです。

小規模サンプル学習は、非常に少ないトレーニング データ (1 ~ 5 個のサンプル/クラス) を通じてモデルの一般化 (機械学習アルゴリズムが新しいサンプルに適応する能力) を実現することに専念しています。

ここで、機械学習における「 事前トレーニング」の概念についても触れておく必要があります。

具体的には、次のような大規模なデータセットの特徴抽出器として強力なニューラル ネットワークを学習することです。

CV(コンピュータービジョン)で一般的な ImageNet で事前トレーニングされた ResNet ネットワーク。

NLP (自然言語処理) で Wikipedia で事前トレーニングされた BERT。

これらはすべて、事前トレーニングである特徴表現の事前知識を表します。

転移学習における「 クーパー学習サークル」理論も同様の原理に基づいています。

事前トレーニングは、人が授業の前に大量の知識ポイントを事前に確認するのと同じように、小さなサンプルに学習の良い出発点を与えることに相当します。

もちろん、より良い結果を達成したい場合は、メタ学習の概念も理解する必要があります。簡単に言えば、継続的な学習を通じて、より良い結果をもたらす機械学習の方法を見つけることです。

つまり、 人工知能と機械学習とは、簡単に言えば、人間の思考を継続的に学習し、模倣するプロセスです。

人工知能についてさらに詳しく知るには、Dongfang Linyu をフォローしてください。

添付ファイル:

少数ショット学習論文が NeurIPS 2020 に採択されました

介入型少数ショット学習は、以下から入手可能です。

https://arxiv.org/abs/2009.13000

論文のコードは Github でオープンソースとして公開されています。

https://github.com/yue-zhongqi/ifsl

<<:  アルゴリズムの微積分: 面接で目立つための関数微分公式 5 つ

>>:  5歳の子供がAIを圧倒、「遊ぶ」だけで十分か?

ブログ    
ブログ    
ブログ    

推薦する

2024 年に AI は他に何ができるでしょうか?これらの10のトレンドは注目すべきである

正月休みが終わり、心身ともに仕事に復帰できましたか?新年を迎え、私のように、お金を稼ぐために働きたい...

...

人工知能とビッグデータが心理学の分野に参入

人工知能とビッグデータの時代の到来により、心理学の研究に新たな扉が開かれました。人工知能は心理学実験...

ゲーム依存症対策は年々厳しくなり、顔認証対策は厳しすぎるとの報道も

[[415155]]未成年者のゲームプレイの問題に関しては、依存症防止システムが厳しすぎると不満を言...

AI面接ロボットのバックエンドアーキテクチャの実践

01 はじめにAI面接ロボットは、Lingxiインテリジェント音声セマンティックプラットフォームの人...

アリババ、量子アルゴリズムとエラー訂正の探究をサポートする量子シミュレータ「Taizhang 2.0」をオープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ロボットが家庭に入り、人工知能の夢はもはや高価ではない

[[221538]]人工知能とは何ですか? 「第一次産業革命における蒸気機関、第二次産業革命における...

理解を助ける7種類の人工知能

[[269361]] [51CTO.com クイック翻訳] 人工知能は、これまでで最も驚くべきイノベ...

IoTミツバチ:私たちの未来を救う技術

ミツバチは植物から植物へと飛び回って餌を探しながら、受粉という重要な役割も担っています。しかし、過去...

...

...

...

...

JD Search EE リンクの進化

検索システムにはヘッド効果が存在する可能性が高く、高品質のミッドテールおよびロングテール製品が十分な...

「最もわかりにくい」Paxos アルゴリズムと、データベースの高可用性におけるその使用法をわかりやすい言葉で理解する

最近、Paxos アルゴリズムについてみんなが議論しています。私はオンラインで多くの記事を読みました...