柯潔はなぜ「負けてカッとなった」と言ったのか！人間対機械の第一ラウンドを説明する8つの質問

4時間以上の対局の末、柯潔はAlphaGoに0.25ポイント差で負けた。

対局後、アルファ碁の指導に参加していたチェスプレイヤーのファン・フイ氏は、囲碁プレイヤーのチャン・ハオ氏（九段）とともに対局の全過程を振り返った。柯潔氏はまた、ディープマインド創設者のデミス・ハサビス氏とアルファ碁のメインプログラマーであるデビッド・シルバー氏とのメディアインタビューに応じ、ゲームに対する考えを語った。

AlphaGoは全体的な状況の展開に焦点を当てている

ファン・フイ氏は、今年初めのマスターの60局の試合の後、多くのチェスプレーヤーもポイント33戦略を使おうとしていたと述べた。そして柯潔もこのオープニングを真似した。

張昊氏は分析の中で、ゲーム全体の中で最も印象に残ったのは、ゲーム開始直後の24手で白が打った大きな飛手だったと述べた。これは、この手が将来のゲームでより効率的になるため、AlphaGoが中心力の発展とチェスのゲームの厚さと展開にさらに注意を払ったことを示している。

AlphaGo のもう一つの印象的な手は、ゲーム開始直後に盤面の左上隅で行われたブレイク手でした。休憩前は黒（柯潔）が厚く見えましたが、その後は白（AlphaGo）も厚くなりました。チャン・ハオ氏は「これは後退だが、後味は大きい」と語った。

24手目は「大飛」、54手目は「破」

「この手は私たちに新しいアイデアをもたらします。チェスの中には不可能な手もあります。それをプレイした後、私たちは新しいアイデアを思いつくでしょう。それは革新的な考え方を提供します。私たちはそれを一緒に研究し、囲碁のプレイ方法をさらに発展させることができます。」

囲碁の駒に囲まれた 4 つの文字は絶望的に見えますが、AlphaGo はこれら 4 つの駒をさらに活用します。盤上のすべての駒の価値を活用したいのです。

柯潔：負けた後に怒りがこみ上げてきた

柯潔は対局を振り返る際、54手目の打破にも賛同の意を表明した。彼は「衝撃を受けた。これは人間として許されないことだ」と語った。休憩後は足元が固まり、太くなり一石二鳥でした。

柯潔はため息をついた。「本当に素晴らしい試合だった。怒ることなく負けた。」

デミス・ハサビスは試合後、とてもエキサイティングな試合だったと語り、柯潔をとても尊敬していると語った。この試合での彼のパフォーマンスは称賛に値するものだった。彼は、柯潔が粘り強さと抜群の強さを見せ、試合前に多くの準備もしたと信じていた。

「柯潔は戦略と戦術の両方を準備しました。例えば、今年初めに名人と対戦した60局のまとめである3-3手です。彼は独自の戦略を持っており、彼の手のいくつかは非常に美しいです。24手目はゲーム全体を救う手です。これからさらに多くの対局が予定されていますが、私は柯潔をとても尊敬しています。AlphaGoでさえ、あなたに対処するために全力を尽くさなければなりません。」

対局の結果は出たものの、AlphaGoと柯潔に対する外界の好奇心は満たされていない。インタビュー中、双方とも皆さんが気になる多くの質問にも答えてくれました。

柯潔はなぜ試合後に笑ったのか？

柯潔は、それはとても幸せな笑顔ではなく、苦い笑顔だと言った。

「アルファ碁は早い段階で負けることが分かっていた。アルファ碁の各手は一定の速度で進み、最終段階に到達する頃には、どれだけ負けるかが既に分かっていた。」

柯潔は自身について、「AlphaGoは見事なプレーを見せたが、私もベストを尽くした。AlphaGoのプレーは素晴らしく、プレーヤーにとって学び、探求する価値のあることがたくさんあった。AlphaGoは囲碁の概念に影響を与え、囲碁の初期の打ち方を変えた。打てないものはない。AlphaGoに対する考え方も変えた。私たちは大胆に革新し、考えを広げ、自由に囲碁を打つことができる。今日、私も大胆に考えを広げた」と語った。

柯潔氏もAlphaGoの戦略を利用してこれに対処したいと考えていた。「私の印象では、AlphaGoは3-3方式のような地面でのプレイを非常に好んでいます。私も今日この戦略を使用しました。しかし、この意図はAlphaGoに打ち負かされ、完全に調子に乗ってしまいました。本当にうまくプレイしました。」

柯潔氏は、AlphaGo は昨年と比べて全く違う 2 人のプレイヤーのようにプレイしていると考えている。最初は人間に非常に近かったのですが、今ではどんどん「神」に近づいてきています。

AlphaGo には弱点がありますか?

柯潔氏は、今のところ弱点は見られないと考えている。過去には弱点もありましたが、現在ではAlphaGoのチェスに対する理解力と判断力は我々よりもはるかに優れており、AlphaGoが勝ちたいのであれば、いくつかのバグを見つけるしかありません。

しかし彼はまた、「常に自分に自信を持ちなさい」とも言いました。

ハサビス氏は、チェスプレイヤーたちが、自分たちと対戦する際には気づかなかったアルファ碁の弱点や欠陥を見つけてくれることを期待して、イ・セドル氏に続いて再び大会に参加したと語った。

「イ・セドルは第4局でこのギャップを発見し、その後私たちはシステムを改良しました。もちろん、私たちもAlphaGoも知らない新しい領域もあるでしょうから、私たちは大会に参加するつもりです。」

デビッド・シルバーは、アルファ碁のアプローチは、近接性でゲームに勝つことではなく、勝利の可能性を最大化することだったと説明した。よりリスクの少ない勝利のチャンスを提供する特定のルートを探します。それはまた、勝利の割合を最大化する方法を決定するトレードオフの問題でもあります。もちろん、勝利に向けてより大きな一歩を踏み出すなどの他の目標もあり、勝利だけに焦点を当てている場合は、リスクを軽減し、小さなリスクにも注意を払う可能性があります。

Go への影響は?

ハサビス氏は、囲碁は大きな可能性を秘めた非常に興味深い科目だと考えている。競争を通じて、私たちは囲碁に対する理解を深めることができます。これは、優れたプレイヤーが囲碁の謎をさらに発見するのに役立つツールです。

AlphaGo はチェスプレイヤーのトレーニングに完全に依存しているのでしょうか?

デビッド・シルバーは、AlphaGo は最初から人間から学習したと説明した。AlphaGo は自分自身と対戦して学習すると同時に、人間の専門家とも対戦する必要があった。なぜなら、最高のプレイヤーと対戦することによってのみ、AlphaGo は上達できるからだ。新しいバージョンは、自分自身と対戦することでより多くのことを学習し、自己探索を実現し、人間のデータへの依存度が低くなります。 DeepMind の目標は、そのルールを Go を超えて拡張し、他の分野に適用することです。

トップ囲碁プレイヤーの柯潔を破った後、AlphaGoは引退するのでしょうか？

ハサビス氏はこの質問に直接答えず、次のステップは今週後半に発表されるとだけ述べた。最初のバージョンが学術誌に技術的な詳細を発表したのと同様に、将来的には新しいバージョンの詳細も公開し、より多くの技術的な詳細を公開し、他のチームや研究室が独自のバージョンを作成できるようにする予定です。

技術的な詳細は? TPU はいくつありますか?スタンドアロン版ですか?

この大会で使用されたAlphaGoは新しいバージョンであり、新しいアルゴリズムが改良されています。主な改良点は、計算量が10分の1に削減され、自己対戦能力が強化されたことです。

ハサビス氏は、昨年は分散して実行されていたが、大会中はプログラムは1台のマシンで実行されたと語った。今回は、よりシンプルで優れた動作を実現するより強力なアルゴリズムがあり、結果がより速く得られます。

ハサビス氏は、「Google クラウドでは、TPU、つまり 10 個の処理ユニットを使用して、計算量を 10 分の 1 に抑えることで」コンピューティング能力が得られると述べた。簡単に言うと、今回のAlphaGoはスタンドアロン版です。

柯潔は二度と人工知能と競争することはないのだろうか？

試合前、柯潔はWeiboに今回の試合が人工知能との3度目の対戦だと投稿した。試合後、彼はその決断を改めて確認した。

「私は長い間考えていました。AlphaGo はあまりにも速く進歩しています。一歩一歩が大きな進歩です。将来はさらに良くなるでしょう。人間と AlphaGo の差は、私たち自身の努力では埋められません。私はテクノロジーの力を信じています。未来は人工知能のものです。囲碁に関しては、私はまだ人間とプレイすることを好みます。なぜなら、機械と人間の差はますます大きくなり、人間が勝つ確率はますます小さくなるからです。このような囲碁をプレイするのはあまりにも苦痛です。1 勝もできません。」

彼は、これは3ゲームのチェスゲームなので、今後は機械を訓練することはないだろうと語った。

「今後も人間とチェスをプレイし続け、ソフトウェアを教師、学習の対象として捉えていきたい」

彼は、自分のパフォーマンスに少し不満があり、もっと上手くできると感じていたが、時にはどれだけ努力してもそれができないこともあると語った。だからこそ、今回は悔いのないように、納得のいく試合をしたいと願っていた。

「AlphaGoのホストコンピュータを熱くすると良いでしょう。」