エンドゲームゲームを使用して人工ニューラルネットワークアルゴリズムを理解する

[[431963]]

この記事はWeChatの公開アカウント「Zhibin's Python Notes」から転載したもので、著者はAn Keです。この記事を転載する場合は、Zhibin の Python Notes 公開アカウントにご連絡ください。

みなさんこんにちは、私はZhibinです〜

ジビンは今、チェスの終盤を迎えており、黒側にはキングが 1 体だけ、白側にはポーン 1 個とキング 1 体だけしか残っていない。これで、ジビンは、白がチェックして黒が勝つか、引き分けかという 2 つの結果が起こり得ることを知っています。

では結末は？次はディープラーニング人工ニューラルネットワークアルゴリズムを使って答えを出していきましょう～

1. ルールの紹介

プログラムをコンパイルする前に、チェスのルールを簡単に理解する必要があります。ルールは次のとおりです。

チェス盤のサイズは 8 x 8 で、黒と白のチェスの駒がそれぞれ 16 個あります。つまり、キング 1 個、クイーン 1 個、ルーク 2 個、ゾウ 2 個、ナイト 2 個、ポーン 8 個です。

兵士: 前進のみ可能 (中国将棋と同様に後退は不可)、一度に 1 マスしか移動できません。ただし、チェスのポーンが最初の動きをするときは、1 マスまたは 2 マス移動できます。ポーンが駒を取る方法は、移動方向によって異なります。ポーンは、まっすぐ移動して駒を取ります。つまり、ポーンの斜め前方のマスの中に相手の駒があれば、それを取ってそのマスを占領することができます。

王：水平、垂直、斜めに移動できますが、一度に移動できるのは 1 ステップだけです。しかし、中国のチェスと比較すると、王は食べ物を与えることができません。つまり、王は敵が支配するマスに入ることができません。そうでなければ、「王を送る」という反則とみなされます。合計 3 回のファウルは負けになります。

勝ち負け：相手の最高司令官である王を捕らえると勝ち、相手を動けなくすると引き分けとなります。

2. 解決策

1 トレーニングセットを読む

krkopt.data トレーニングセットを読み取ります。コードは次のとおりです。

と  ' krkopt.data' 、 'r' )をfとして開きます:
    行 = f.readlines()
    データ = np.zeros((28056,6),dtype= float )
    ラベル = np.zeros((28056,2),dtype= float )

読み取り結果の表示:

上記の各データ行はトレーニングサンプルです。以下に示すように、最初のデータ行を分析の例として取り上げます。

a1、b3、c2 は 3 つのチェスの駒の座標を示します。黒のキングは図に示すように位置 a1 にあり、白のキングは図に示すように位置 b3 にあり、白のポーンは図に示すように位置 c2 にあります。この時、黒キングはもう打つ手がない状態となり、ゲームは引き分けに終わります。そのため、最終引き分けは引き分けを意味します。データの最後のラベルが 6 であると仮定すると、白は最大 6 手で黒を倒すことができることを意味します。

2 トレーニングを開始する

まず、トレーニングに必要な Python ライブラリをインストールします。

 pip インストール numpy
 pip インストール sklearn
 matplotlib を pip でインストールします

次に、データセット全体を 3 つの部分に分割します。コードは次のとおりです。

 ratioTraining = 0.4 #トレーニングデータセット 40%: トレーニングデータセットを使用してニューラルネットワークのパラメータを調整します
ratioValidation = 0.1 #10% 検証データセット: 調整が適切か不適切かを検証し、プログラムを終了するかどうかを決定するために使用されます
ratioTesting = 0.5 #テストデータセット50%: トレーニング後、ニューラルネットワークの全体的なトレーニング効果を測定するために使用されます

次に、Scikit-learn の Scaler クラスを使用して、平均を減算し、分散で割ることで標準を正規化します。コードは次のとおりです。

スケーラー.変換(xTraining)
スケーラー.変換(xTexting)
スケーラー.変換(xValidation)

ニューラルネットワークを作成します。コードは次のようになります。

その中には、layer=[6, 20, 20, 20, 2] 入力は6次元、出力は2次元、合計3層のニューラルネットワークがあり、各層には20個のニューロンがあります。

 active_function = 'relu'ニューラルネットワーク活性化関数
learning_rate=0.01 学習率α
 batch_normalization=1 正規化操作
objective_function = 'クロスエントロピー'目的関数

トレーニング開始後、COST 損失関数は継続的に減少しているのに対し、認識率の精度はゆっくりと増加し、1 に限りなく近づいていることがわかりました。

コードは次のとおりです。

上記の分析の結果、白が勝つ確率は非常に高く、ほぼ 1 に近いことがわかります。

3. まとめ

1. この記事では、チェスの終盤を例に、人工ニューラルネットワークアルゴリズムの実装方法を説明します。後でまた練習していただければ幸いです。

2. この記事は学習参考のみを目的としており、他の目的には使用できません。

コラムニスト：強化学習とマルチエージェントコラボレーションを研究している大学院生、An Ke。勉強が好き、学ぶのが大好き、共有する意欲があり、そして何よりも、彼女は美しい女性です〜

<<: 中国消費者協会：所有者や消費者は顔認識を強制されることはない。情報が漏洩すると非常に有害だからだ。

>>: 毎日のアルゴリズム: スパイラルマトリックス

エンドゲームゲームを使用して人工ニューラルネットワークアルゴリズムを理解する

1. ルールの紹介

2. 解決策

3. まとめ

音声認識におけるCNNの応用

機械学習を使用して Airbnb のリスティングの価格を予測する

普遍近似定理を理解しなければ、ニューラルネットワークを理解することはできない

データ汚染：次の大きな脅威

人工知能の3つの利点と3つの欠点

データ分析とAIのミスが原因の注目度の高い事件9件

AIビデオ監視の普及における3つの大きな課題

ICRA 2022 優秀論文: 自動運転用 2D 画像を鳥瞰図に変換し、モデル認識精度を 15% 向上

ジェミニは、文鑫の言葉が大きな問題を引き起こしていることを明らかにした。世界は質の高いデータの不足に直面しているのだろうか？ 2024年には枯渇するかもしれない

推薦する

この「間違い」は実際には間違っていません。4つの古典的な論文から始めて、Transformerアーキテクチャ図のどこが「間違っている」かを理解してください。

ICLR 2022｜スピードこそすべて！完全なバイナリ化 BiBERT による超圧縮

Metaが人工知能チャットボット「Meta AI」をリリース

長いテキストの復号化畳み込みニューラルネットワークアーキテクチャ

OpenAIはひっそりとその約束を放棄し、大量の社内文書を公開しなくなった

【WOT2018】4人の重鎮専門家が企業ビジネスにおけるNLPの詳細な応用を分析

スペルミスを心配する必要はありません。Microsoft Edge ブラウザに新しいウェブ「スマート検索」AI 機能が追加されます。

インテリジェントな音声対話サービスはますます良くなり、従順であることも芸術である

ディープラーニングの面接で知っておくべきこと

協働ロボットが製造業の未来に与える大きな影響

人工知能と機械学習がもたらす劇的な変化を示す6つの事例

すべてのビジネスデータを使用しても、AI に完全に入力することはできませんか?この小さなサンプル学習キットをお試しください