中国のAI麻雀が新たな高みに到達!テンセントの「Jueyi」が本物のプロプレイヤーを破り新記録を樹立

中国のAI麻雀が新たな高みに到達!テンセントの「Jueyi」が本物のプロプレイヤーを破り新記録を樹立

中国のAIは予想通り、麻雀のプレイでは「楽々と」トップに立った。

テンセントの最新ニュースによると、同社のチェスとカードのAIであるLuckyJが、日本の麻雀プラットフォーム「天鳳」の麻雀分野で新記録を樹立したという。

JueYi LuckyJ が最高 AI ランクに到達するのにかかったゲーム数はわずか 1,321 で、2 位の Suphx より 4,052 ゲーム少ない結果となりました。

さらに、その能力はレベル 10 で安定しています。トップの人間プレイヤーの平均安定レベルはわずか 7.4 であることに留意する必要があります。

写真

日本の麻雀プラットフォーム「天鳳」では、Jueyi LuckyJ は十段に到達したわずか 27 人のプレイヤー (AI を含む) の 1 人となり、プラットフォーム上の平均アクティブ ユーザー数は 238,000 人です。

Jueyi LuckyJ は、日本の麻雀だけでなく、中国の標準麻雀でも 6 人のプロ選手を破り、中国の標準麻雀のプロ選手を破った最初の麻雀 AI となりました。

写真

全国レベルの麻雀プレイヤーの一人が、このようにコメントした。

私たちが通常、素晴らしい動き、ひらめき、あるいは経験と感覚に基づく生死を分ける選択と呼ぶものはすべて、AI にとって日常的な操作である可能性があります。

Jueyi LuckyJが日本の麻雀で十段を獲得した後、多くのネットユーザーが彼を祝福しに来た。

写真

写真

結局のところ、AI が麻雀をプレイする背後で実際に改善されているのは、AI の問題判断能力であり、これは AI が現実世界でより複雑な問題を解決できるようにするのに役立っています。

それで、Jueyi LuckyJ はどうやってそれを実現したのでしょうか?

麻雀AIはよりバランスの取れた戦略を学ぶ必要がある

まず、AIが麻雀をプレイするのがなぜ難しいのかを見てみましょう。

AI にとって、ゲームをプレイすることはその能力をテストする優れた方法です。一般的な形式としては、チェス、囲碁、Honor of Kings などがあります。

その中でも囲碁とチェスは完全情報ゲームです。つまり、両方のプレイヤーは各移動の前にグローバル情報を確認でき、お互いの状況を確認できるということです。

AI は強力な計算能力を使って力ずくで最適な解決策を見つけることができるため、これは AI にとって難しいことではありません。

しかし、麻雀をプレイする状況は複雑です。

複数のプレイヤーのカードが見えないだけでなく、公開されていないカードに大量の情報が隠されている、典型的な不完全情報ゲームです。

つまり、AI プレイヤーも人間のプレイヤーも、最初は手札の 13 枚のカードしか見えず、残りの 100 枚以上のカードは不明です。さらに、カードをプレイするたびに、カードを食べるか、カードに触れるか、ゲームに勝つかなど、一連の複雑な決定を下す必要があり、その決定では攻撃と防御の両方も考慮する必要があります。

同時に、他のプレイヤーがカードを拾う、カードに触れる、カードをまとめるなどの操作をすると、次回カードを引く順番が変わってしまい、決定がより複雑になります。

横軸が観測可能な情報量、縦軸が隠された情報量を表すこのようなグラフでは、麻雀に含まれる隠された情報が他のボードゲームよりもはるかに多いことがわかります。

写真

それで何をすればいいのでしょうか?

Tencent AI Labは、強化学習と後悔値の最小化に基づくセルフゲーム技術を提案しました。

これにより、AI は自己学習してゼロから能力を向上させ、最終的に最強のハイブリッド戦略に収束し、実際の戦闘でよりバランスの取れた戦略能力を発揮できるようになります。

同時に、従来の不完全情報探索アルゴリズムが麻雀で大きな役割を果たす可能性は低いことを考慮して、研究者らは楽観的価値推定の考えに基づく効率的な不完全探索法も提案し、AIが大量の隠された情報のゲーム状態で現在の戦略をリアルタイムで調整し、変化する戦況にうまく対応できるようにしました。

研究者によると、AIは人間と比べて麻雀ゲームにおいてよりバランスの取れた戦略を持ち、各カードをプレイすることで期待される利益や、将来的にどのカードが勝つ可能性があるかなど、状況を非常に正確に計算できるという。このような「戦略」の訓練により、AIは将来、より早く他業界に参入できるようになるでしょう。

実戦テストでは、Jueyi LuckyJが「Tianfeng」に出場しました。

2006年に設立された古い日本の麻雀ゲームプラットフォームです。

ブートストラップ分布から判断すると、LuckyJ は他の 2 つの日本の麻雀 AI (Suphx と NAGA) よりも大幅に強力です: LuckyJ vs Suphx p 値 = 0.02883、LuckyJ vs NAGA p 値 = 3e-05。

写真

さらに、全国標準麻雀の約2,000ゲームで、LuckyJの平均勝利点は1.76ポイントに達しました。

(ここで「ファン」とは、国家標準麻雀の決着単位を意味します。値が大きいほど勝ちとなります。)

写真

写真

ゲームAIはさまざまな業界で応用されている

しかし、私たちがAIの麻雀能力の向上にここまで苦労したのは、単に麻雀をやらせるためだけではありません。

テンセント AI ラボの研究者によると、ゲーム環境における AI の意思決定能力の向上の最終的な目標は、AI が仮想世界から現実世界に移行し、現実世界の複雑な問題を解決できるようにすることです。

現実の世界には、金融取引、自動運転、輸送物流、オークションシステムなど、不完全な情報に基づいて意思決定を行う必要があるシナリオが数多くあります。

さらに、Tencent AI Labにはすでに実例があります。

同社のもう一つの意思決定 AI 製品である Juewu は、従来の方法の 400% の効率で、フルフィルム病理スキャンにおける病変の位置を特定することを学習しました。

写真

映画を視聴するための最適なパスを見つけるこの AI 手法は、強化学習に基づいています。

従来の徹底的な手法を使用してローカル画像ブロックを分析するのではなく、まず観察価値のある領域を見つけ、複数の解像度レベルにわたって代表的な特徴を取得して、フィルム全体の解釈を加速します。

人間の思考を模倣することで、映画鑑賞の効率が向上するだけでなく、コストも節約できます。

まとめると、「Minecraft」をプレイできるJuewuはすでに世界を救うことができ、麻雀をプレイできるJueyiが今後何をするのかも楽しみになります。

Jueyi LuckyJ はどのような方向に応用できると思いますか?

<<:  Gonex CEO ウェン・メンフェイ氏との独占インタビュー: アプリケーションの分野では、モデル自体よりも意図の認識の方が重要です。

>>:  次世代言語モデルパラダイム LAM が登場します! AutoGPTモデルがLLMを席巻、計画、メモリ、ツールの3つの主要コンポーネントの包括的なレビュー

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ビジネスリーダーがAIを導入する際に指針となる5つの基本原則

たとえば、私が 25 年以上携わってきた市場調査業界を考えてみましょう。 AI は、さまざまな方法で...

LK-99は今もメロンを生産中:元のサンプルは韓国エネルギー技術研究所に届けられ、薄膜プロセスは最後の懸案

中国科学院物理研究所とプリンストン大学による2本の否定的な論文の発表により、LK-99に対する人々の...

Microsoft の 37 ページの論文では、Sora をリバース エンジニアリングしています。どのような結論に達したのでしょうか。

現段階では、Sora に追いつくことが多くのテクノロジー企業の新たな目標となっている。研究者たちが興...

AI イニシアチブを成功させるために必要な 10 のこと

市場で競争上の優位性を獲得する過程で、多くの企業が新興技術の導入に熱心です。しかし、導入を急ぐあまり...

統計分析と人工知能の9つの有名な大惨事

2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...

AI は鉱業をどのように改善できるのでしょうか?

[[279594]]データとマイニングという言葉を組み合わせると、IT とテクノロジーが連携して企...

ChatGPT、画像や動画コンテンツを生成するCanvaプラグインをリリース

9月4日、ChatGPT Plusサブスクリプションサービスで独自のCanvaプラグインがリリースさ...

指紋、顔、音声認識技術は、本当に簡単に解読できます。

【AI世代編集部注】顔認識は今年、CCTVの315ガラで痛烈に批判された。この技術は人々が安心して...

過去10年間のGoogleアルゴリズムの変化

Google のアルゴリズムは毎年 500 ~ 600 回も変更されますが、その多くは小さな変更です...

...

AIは人間ではないため、米国特許庁はAIの発明の全てを認めない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ChatGPT の機能低下が論争を引き起こしています。AIGC アプリケーションは依然として信頼できるのでしょうか?

スタンフォード大学とカリフォルニア大学バークレー校(UCLA)の研究者による新しい研究では、これらの...

階乗関連のアルゴリズムとその C++ 実装

階乗とは、必要な数値が得られるまで 1 × 2 × 3 × 4 を掛け合わせることを意味します。 C...

5Gネットワ​​ーク構築80%:5Gロボットが新たな転換点を迎えようとしている

最近、CCTVニュースによると、中国は2月末までに計画通り5Gネットワ​​ーク構築の80%を完了した...