ニューラルコンピュータAIモデルのブレークスルー！トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

[[326502]]

今週、IBMは、同社のニューラル・コンピュータ・システムが1秒あたり120万フレームのトレーニング時間を達成し、新記録を樹立したと主張した。 IBM は、最先端のテクノロジーに匹敵する AI モデルトレーニングのブレークスルーを達成しました。ネットユーザーからは信じられないという声が上がった。

IBMは今年初めに発表した論文で、ニューラル・コンピュータについて詳しく説明しました。これは、新興の AI アルゴリズムと計算神経科学の研究開発用に設計された再構成可能な並列処理システムです。

今週、同社はニューラルコンピューターの最初のアプリケーションであるディープニューロエボリューションシステムを実演した。このシステムは、Atari 2600 ハードウェア実装、画像前処理、AI アルゴリズムを最適化されたパイプラインに組み合わせています。

実験で報告された結果は最先端のものと匹敵するが、さらに重要なのは、IBM がシステムが 1 秒あたり 120 万フレームのトレーニング時間を達成し、新記録を樹立したと主張していることである。

ネットユーザーたちは「信じられない！」と叫んだ。

ニューラルコンピュータは、AIコンピューティングの軍拡競争における警告信号のようなものです。

OpenAIが公開した分析によると、最大規模のAIトレーニング実行で使用されるコンピューティング量は2012年から2018年にかけて30万倍に増加し、トレーニング時間は3.5か月で倍増し、ムーアの法則のペースをはるかに上回っています。

AlexNet から AlphaGo Zero へ: 計算量は 30 万倍

まずはIBMのニューラルコンピュータについて学びましょう

IBM ニューラル・コンピュータ

IBM のニューラルコンピュータは、IBM の長期戦略パートナーである Xilinx のフィールドプログラマブルゲートアレイ (FPGA、製造後に構成できるように設計された集積回路) である 432 個のノード (16 モジュールカードごとに 27 個のノード) で構成されています。

IBMのニューラルコンピュータはモジュールカードあたり27個のノードを持つ

各ノードには、Xilinx Zynq システムオンチップ (同じチップ上に FPGA とペアになったデュアルコア ARM A9 プロセッサ) と 1 GB の専用 RAM チップが搭載されています。

ノードは 3D グリッドトポロジーで配置され、シリコンウェーハまたはチップを完全に貫通するシリコン貫通ビアと呼ばれる電気接続によって垂直に相互接続されます。

ノード番号は3Dメッシュトポロジーで確認できます

ネットワークに関しては、FPGA は複数の異なる通信チャネルを確立するために、モジュールカード間の物理的な通信へのアクセスを提供します。

理論上は、1 枚のカードで最大 432GB/秒の転送速度をサポートでき、ニューラルコンピューターのネットワークインターフェイスは自動的に調整され、特定のプログラムに合わせて徐々に最適化されます。

「私たちのシステムは、各ノードがアプリケーション固有のプロセッサオフロードを可能にするという点でユニークです。これは、私たちが知る限り、あらゆる規模の並列コンピュータでは利用できない機能です」と、ニューラルコンピュータフレームワークの概要を説明する論文の共著者は書いています。「パフォーマンスが重要なステップのほとんどは、ARM プロセッサのサポートにより、FPGA でオフロードおよび最適化されます。」

ニューラルコンピューターについてある程度わかったところで、IBM はニューラルコンピューターの最初のアプリケーションデモンストレーションで、どのようにして 120 万フレーム/秒という記録破りのトレーニング時間を達成したのでしょうか。

[[326505]]

調べてみましょう

Atari ゲームで AI をテストする

ビデオゲームをテストに使用することは、AI および機械学習の研究に最適なプラットフォームです。

これらはテストにすぐに利用できるだけでなく、大規模に実行しても安価です。

例えば、強化学習などの特定の分野では、報酬を得るために、AIは環境と相互作用することで最適な行動を学習し、ゲームのスコアが最も直接的な報酬となります。

ゲーム分野で開発された AI アルゴリズムは、タンパク質の折り畳み予測研究など、より実用的な用途に有望であることが示されています。 IBM ニューロコンピュータのテスト結果が再現されれば、このシステムを使用して AI アルゴリズムの開発を加速できる可能性があります。

研究者らはニューラルコンピューターのカード1枚につき26個のノードを使用し、合計416個のノードを使用した。

Atari ゲームアプリケーションの 2 つのインスタンスが 416 個の FPGA ノードそれぞれで実行され、各インスタンスが並列に実行されて最大 832 個のノードまで拡張されます。

各インスタンスは、指定された Atari 2600 ゲームからフレームを抽出し、画像の前処理を実行し、機械学習モデルを通じて画像を実行し、ゲーム内のアクションを実行します。

ディープニューラルネットワークを使用して FPGA 上でゲームをトレーニングするスクリーンショット

最高のパフォーマンスを実現するために、研究チームは Atari 2600 のエミュレーションを避け、代わりに FPGA を使用してコンソールの機能をはるかに高い周波数で実装することを選択しました。

彼らは、現代のハードウェアを使用してコンソールとアーケードマシンを再現することを目的としたオープンソースの MiSTer プロジェクトのフレームワークを採用し、Atari 2600 のプロセッサクロック周波数を 3.58 MHz から 150 MHz に上げ、1 秒あたり約 2,514 フレームを生成しました。

画像の前処理ステップでは、IBM のアプリケーションはフレームをカラーからグレーに変換し、ちらつきを除去し、画像をより小さい解像度に再スケーリングしてから、フレームを 4 つのグループに積み重ねます。

次に、ゲーム環境を推測する AI モデルと、AI モデルによって予測された最大報酬を識別して次のフレームのアクションを選択するサブモジュールに渡されます。

IBM の研究者は 5 回の実験を通じて、ニューラルコンピューター上で 59 個の Atari 2600 ゲームを実行しました。

結果によると、このアプローチは他の強化学習技術ほどデータ効率が良くなく、合計 60 億のゲームフレームが必要となり、Montezuma’s Revenge や Pitfall などの難易度の高い探索型ゲームでは失敗しました。

Deep Qネットワークは59試合中30試合に勝利し、トレーニングに10日かかりましたが、IBMチームはトレーニングにわずか6分しかかかりませんでした（トレーニングフレーム2億枚）。

59 の Atari 2600 ゲームの 60 億のトレーニングフレームを備えたニューラルコンピューターで実行し、2 桁も短い時間 (2 時間 30 分) でトレーニングしながら、36 のゲームで Deep Q ネットワークを上回りました。

<<: 企業はビッグデータアルゴリズムを使用して効果的なリンクを構築できますか?

>>: ついにデータサイエンス、機械学習、人工知能を説明する人が現れる

ブログ

Google、AIが出力コンテンツの正しさを自己判断できるモデルトレーニングフレームワーク「ASPIRE」をリリース

ニューラルコンピュータAIモデルのブレークスルー！トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

IBM ニューラル・コンピュータ

Atari ゲームで AI をテストする

Google、AIが出力コンテンツの正しさを自己判断できるモデルトレーニングフレームワーク「ASPIRE」をリリース

AIと機械学習がIoTと密接に関係する理由

防衛とセキュリティの再定義に貢献するAIスタートアップ

4つのレベルから見た人工知能の経済分析

AIが5分で「3D展示」を完成させる「魔法の博物館」を制作

3nmなのに歯磨き粉を絞ってるだけ？ A17 Proの実行スコアが公開：CPUマルチコアはわずか3.6%向上

MyScale を使用して知識ベースを OpenAI の GPT にインポートする方法

フェデックスが分析と AI を活用してサプライチェーンを強化する方法

GPT-4を粉砕せよ！ Google DeepMind CEOが明かす：次世代の大規模モデルはAlphaGoと統合される

推薦する

アルゴリズムだけでは不十分：AIの次のブレークスルーにはハードウェアの再検討が必要

ChatGPTはカスタムコマンドを起動します。一度言って覚えておけば、話すたびにそれに従います。

2021 年の人工知能のトップ 10 トレンド

太陽光パネルを日中に検査するためのドローンベースのSWIRカメラ

ホライゾン・ロボティクス、中国初のオープンで使いやすいソフトウェアとハードウェアの統合ロボット開発プラットフォームを発表

エントリーレベルのデータベースアルゴリズム [パート 3]

人工知能は200年以上前の進化のパズルをどうやって解くことができるのでしょうか?

OpenAI: 大規模ニューラルネットワークをトレーニングするための 4 つの基本手法

クラウドAI市場は2028年までに2,700億ドルに達すると予想

データサイエンスと機械学習のための珍しいPythonライブラリ

人工知能技術は建設業界をどのように変えるのでしょうか?

Sora では 1 分間のビデオを生成するのに 1 時間以上かかります。これによりユーザーエクスペリエンスにどのような変化がもたらされるのでしょうか?