GoogleのAI設計チップから「知能」の本質がわかる

先週、査読付き科学誌「ネイチャー」に掲載された論文で、Google Brain チームの科学者らは、AI の力を使ってコンピューターチップ内のさまざまなコンポーネントの配置を調整する、レイアウト計画のための深層強化学習技術を紹介した。研究者たちは、強化学習技術を利用して、Google が誇る専用 AI プロセッサである Tensor Processing Unit の次世代を設計することに成功した。

チップ設計にソフトウェアを使用することは目新しいことではないが、Google の研究者らは、この新しい強化学習モデルは「チップレイアウト図を自動的に生成し、その結果はさまざまな主要指標 (消費電力、パフォーマンス、チップ面積など) の点で人間が提供するチップレイアウトソリューションと同等かそれ以上である」と述べている。さらに、その設計サイクルは人間の作業時間よりもはるかに短い。

実際、多くの分野で人間を上回るAIの知能レベルは、各方面から注目を集めています。あるメディアはこれを「人間のスピードを超えるスピードでコンピューターチップを設計できるAIソフトウェア」と評し、「Googleの新しいAIは、人間のエンジニアなら完成させるのに数か月かかるチップ設計をわずか6時間で行うことができる」と述べた。

別のレポートでは、「AI設計チップの分野におけるAI技術の壮大なビジョンは始まったばかりだ」と考えています。

しかし、この論文を読んで、私が本当に感銘を受けたのは、コンピューターチップの設計を担うこの AI システムの極端な複雑さではなく、人間と AI の調和のとれた効率的なコラボレーションでした。

類推、直感、報酬

この論文では、解決すべき問題について次のように説明しています。「チップのフロアプランニングプロセスでは、チップキャンバス (2 次元グリッド) 上にネットリストを配置して、厳格な密度制限と配線混雑制約を遵守しながら、パフォーマンスメトリック (電力、タイミング、面積、配線長など) を最適化します。」

基本的に、このタスクの中核は、チップコンポーネントを最適な方法で配置することです。しかし、他の古典的な問題と同様に、チップコンポーネントの数が増え続けると、最適な設計を見つけることはますます困難になります。

既存のソフトウェアはチップ配置の発見を高速化するのに役立ちますが、対象チップの複雑度が高すぎる場合、従来のソフトウェアソリューションでは明らかにニーズを満たすことができません。研究者たちは、強化学習が他の複雑な空間問題を解決する多くの例から教訓を引き出すことに決め、この点で囲碁 AI に大きな可能性があることを発見しました。

「チップのフロアプランニングは囲碁に非常に似ており、駒（ネットリストトポロジー、マクロ数、マクロサイズ、アスペクト比など）、盤（さまざまなキャンバスサイズとアスペクト比）、勝利条件（密度や配線混雑制限などのさまざまな評価指標の相対的な重要性など）がある」と研究者らは論文に記している。

チップの設計には、人間の知能の中で最も重要かつ複雑な要素の 1 つである類推力が必要です。私たち人間は、以前に解決された問題から抽象的な教訓を抽出し、その教訓を新しい問題に適用することができます。この能力の使い方は、微妙でスムーズかつ自然であると言えますが、それ自体が非常に重要であり、転移学習を実現するための前提条件であるとも言えます。このようにして、研究者たちはチップレイアウト問題をボードゲームとして捉え直し、他の科学者が囲碁に取り組んだのと同じように設計パズルに取り組むことができました。

深層強化学習モデルは、この広大な空間を探索するのに特に優れていますが、人間の脳の計算能力では、そのような処理は物理的に不可能です。しかし、科学者が直面しているチップ設計の課題は、囲碁よりも数桁も難しいものです。研究者らは、「1,000 個のノードのクラスターを 1,000 個のセルを含むグリッドに配置すると、その状態空間は 1,000 のオーダー (10 の 2500 乗以上) に達するが、囲碁の状態空間は 10 の 360 乗に過ぎない」と書いている。実際に設計する必要があるチップは、多くの場合、数百万個のノードで構成されている。

最終的に、彼らは人工ニューラルネットワークを使用して複雑さの問題を解決しました。人工ニューラルネットワークは、チップ設計をベクトル表現にエンコードし、問題空間の探索の難しさを大幅に軽減できます。論文によると、「日常的なチップ配置タスクを実行できるポリシーは、推論中に新しい、目に見えないチップ関連の状態を意味のある信号にエンコードすることもできるはずだという直感があります。そのため、新しいネットリストの場所に対する報酬を予測できるニューラルネットワークアーキテクチャをトレーニングし、このアーキテクチャをポリシーのエンコーダーレイヤーとして使用することを最終目標としています。」

私の友人の多くは、「直感」はあまり信頼できないと考えていますが、直感の背後には、経験、無意識の知識、パターン認識などを含む非常に複雑であまり知られていないプロセスがあります。私たちの直感は、多くの場合、特定の分野での長年の経験から生まれますが、他の職業からもインスピレーションを得ています。幸いなことに、高性能コンピューティングと機械学習ツールの助けにより、直感的な判断をテストすることが容易になっています。

強化学習システムには、慎重に設計された報酬メカニズムが必要であることも注目に値します。実際、正しい報酬関数が設定されていれば、強化学習だけで人工汎用知能 (AGI) を実現できると考える科学者もいます。適切な報酬がなければ、強化学習エージェントは無限ループに陥り、愚かで無意味な試行を繰り返す可能性があります。以下のビデオでは、強化学習エージェントがセーリングレース選手権に出場し、本当に重要な目標であるレースでの勝利ではなく、高得点を追い求めている様子を見ることができます。

Google の科学者は、レイアウト計画システムの報酬を「エージェントのラインの長さ、混雑度、密度の負の加重合計」として設計することを決定しました。ここでの重みは、強化学習モデルの開発とトレーニング中に調整する必要があるハイパーパラメータです。

適切な報酬が与えられると、強化学習モデルは計算能力を活用して、報酬を最大化するフロアプランを設計する方法を見つけることができます。

キュレーションされたデータセット

システムで使用されるディープニューラルネットワークは、教師あり学習を通じて開発されました。教師あり機械学習では、トレーニング中にモデルパラメータを調整するためにラベル付けされたデータが必要です。 Google の科学者は、「10,000 個のチップ部品配置シナリオのデータセットを作成しました。入力情報は特定の配置に関連付けられた状態であり、ラベルはその配置に対する報酬です。」

配置計画を手動で作成することを避けるために、研究者はデータセット内で手動で設計された図面だけでなく、コンピューターで生成された大量のデータも使用しました。この論文では、評価トレーニングデータセットに含まれるアルゴリズム生成例のうち、人間のエンジニアによって設計されたものがどの程度あるかについては詳しく説明されていませんが、高品質のトレーニングデータがなければ、教師あり学習モデルは最終的に推論の結論の質が低下することは確かです。

この意味で、チップ設計 AI システムは、他の強化学習プログラム (たとえば、人間の介入をまったく必要とせずに囲碁をプレイするための強力な戦略を開発できた AlphaZero) とは明確に異なります。しかし将来的には、研究者らは、教師あり学習の要素なしに、フロアプランを自律的に設計できる可能性のある新しい強化学習エージェントを開発する可能性があります。しかし、私の個人的な推測では、設計作業の複雑さを考えると、そのような問題を解決するには、人間の直感、機械学習、高性能コンピューティングの強力な組み合わせが依然として必要になる可能性があると思います。

強化学習設計とヒューマンデザイン

Google の研究者による調査により、さまざまな興味深い結論が導き出されましたが、最大の注目点はチップの実際のレイアウトです。私たち人間は、脳の物理的な限界を克服するために、あらゆる種類の近道を活用します。多数の複雑な要素を含む「硬い骨」に一度に取り組めるわけではありませんが、人間の脳は複雑なシステム全体をモジュール化、階層化して、段階的に課題を克服していきます。アーキテクチャをトップからボトムまで考慮して設計するこの能力は、非常に複雑な問題を解決する責任を負うシステムにおいて、間違いなく重要な役割を果たすでしょう。

ここでは、私（著者）自身の専門分野であるソフトウェアエンジニアリングの例を見てみましょう。理論的には、プログラム全体を 1 つのファイルに、途切れることのない巨大なコマンドストリームとして記述することは確かに可能です。しかし、ソフトウェア開発者はこのようにプログラミングすることはありません。コードスニペット、関数、クラス、モジュールから始めて段階的にソフトウェア製品を構築し、明確に定義されたインターフェイスを通じてさまざまなコンポーネントを接続するだけです。これを基に、中間結果をより大きなシステムに組み込み、コンポーネントベースで階層化されたアーキテクチャのセットを徐々に構築していきます。こうすることで、プログラムを一行ずつ読まなくても、プログラムがどのように動作するかを理解できます。モジュール式のメカニズムにより、複数のプログラマーが同時に同じプログラムを開発することができ、元のプログラムのコンポーネントを後続のプログラムで使用できるようになります。場合によっては、プログラム内のクラスアーキテクチャを観察するだけで、バグを見つけるための正しいパスや、アップグレードを追加する適切な場所を見つけるのに十分なことがあります。このため、私たちは、より高いレベルのモジュール性とより高い設計品質と引き換えに、速度を犠牲にすることがよくあります。

同じガイドラインがコンピュータチップの設計にも適用されます。人間が設計したチップでは、異なるモジュール間に明確な境界があることがよくあります。一方、Google の強化学習エージェントによって設計されたフロアプランは、人間の脳の思考能力に制限されることなく、最も抵抗の少ない経路を見つけることができます。

この AI 支援設計モデルが将来的に新たなトレンドになるのか、あるいは標準になるのか、非常に興味があります。言い換えれば、機械学習によって生成された高度に最適化されたソリューションは、人間のエンジニアによって課されたトップダウンの考慮事項とよりよく一致するように妥協する必要があります。

AI + 人間の知能

Google の強化学習チップ設計者が述べているように、AI のハードウェアとソフトウェアの革新の探求は、抽象的思考、問題の特定、解決策の直感、検証データの選択など、人間が提供する重要な能力に依然として依存しています。つまり、AIチップはこれらのスキルを継続的に強化することはできますが、完全に置き換えることは困難です。

結局のところ、この成果の発表は「AIが人間を超えた」「AIはより賢いAIを作れる」「AIは自己再帰的で自己強化的である」ということを意味しているとは思えません。より正確に言えば、主題は依然として人間です。人間は、認知的限界を克服し、能力を拡大するためのこれまでにない強力なツールとして AI を使用する実行可能な方法を模索しています。このような好循環が本当に発展し、成熟することができれば、コンピューターチップの設計は AI と人間が協力するための理想的なシナリオになると思います。

<<: 会話型 AI は FMCG 業界でどのように導入されていますか?

>>: 人工知能の時代に教育はどのように適応すべきでしょうか?