マイクロソフトは、兆パラメータのAIモデルのトレーニングに必要なGPUを4,000から800に削減しました。

マイクロソフトは、兆パラメータのAIモデルのトレーニングに必要なGPUを4,000から800に削減しました。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

マイクロソフトは本日、数兆個のパラメータ(予測の根拠となるモデル内の変数)を含む AI モデルをトレーニングする新しい方法を導入する DeepSpeed ライブラリの更新バージョンをリリースしました。 Microsoft によれば、3D 並列処理と呼ばれるこのテクノロジは、さまざまなワークロードのニーズに適応でき、特に電力を大量に消費する非常に大規模なモデルの効率をバランスさせることができるという。

[[341739]]

数十億のパラメータを持つ単一の大規模 AI モデルにより、さまざまな困難な領域で大きな進歩が可能になりました。研究によると、AI が優れたパフォーマンスを発揮できるのは、言語、文法、知識、概念、文脈のニュアンスを理解できるためであり、スピーチを要約したり、リアルタイムのゲーム チャットで不適切な単語を除外したり、複雑な法的文書を解析したり、さらには GitHub を検索してコードを生成することも可能になります。

しかし、モデルのトレーニングには大量のコンピューティング リソースが必要です。 2018年のOpenAIの分析によると、大規模なAIトレーニングに必要なコンピューティング能力は2012年から2018年にかけて30万倍に増加し、およそ3.5か月ごとに倍増し、ムーアの法則のペースをはるかに上回っています。

強化された DeepSpeed は、データ並列トレーニング、モデル並列トレーニング、パイプライン並列トレーニングという 3 つの技術を活用して、「兆スケール」のモデル トレーニングを可能にします。

1兆パラメータのモデルをトレーニングするには、少なくとも400個のNvidiaの最新A100 GPU(それぞれ最大40GBのメモリを搭載)が必要であり、Microsoftは50%の効率で稼働する4,000個のA100が必要で、トレーニングを完了するには約100日かかると見積もっています。これは、1万枚以上のグラフィックカードを搭載した、マイクロソフトとOpenAIが共同設計したAIスーパーコンピューターにはかないません。これほどの大規模環境では、高い計算効率を達成することは困難です。

DeepSpeed は、大規模なモデルを 4 つのパイプライン ステージに分割し、さらに小さなコンポーネント (レイヤー) に分割します。各パイプライン ステージのレイヤーは、実際のトレーニングを実行する 4 つの「ワーカー」にさらに分割されます。各パイプラインは 2 つの並列データ インスタンス間で複製され、ワー​​カーはマルチ GPU システムにマップされます。 Microsoft によれば、これらおよびその他のパフォーマンスの改善により、1 兆パラメータの AI モデルのトレーニングに必要な Nvidia V100 GPU をわずか 800 個に削減できるという。

DeepSpeed の最新バージョンには、GPU とそのホスト CPU 上のコンピューティング リソースとメモリ リソースを活用して、単一の V100 で最大 130 億のパラメータを持つモデルをトレーニングする ZeRO-Offload テクノロジーも含まれています。マイクロソフトは、これは最先端のものより 10 倍強力であり、データ サイエンティストはより少ないコンピューティング リソースを使用してトレーナーをトレーニングできると主張しています。

「これら(DeepSpeed の新技術)は、極めて高い計算、メモリ、通信効率を提供し、数十億から数兆のパラメータを持つモデルのトレーニングをサポートします」と Microsoft はブログ投稿で述べています。「これらの技術により、極めて長い入力シーケンスも可能になり、単一の GPU、数千の GPU を備えたハイエンド クラスター、または非常に低速のイーサネット ネットワークを備えたローエンド クラスターを備えたハードウェア システムのパワーが解放されます。当社は、ディープラーニング トレーニングの速度と規模の限界を押し広げながら、急速に革新を続けます。」

<<:  企業がAI対応データベースを使用してAI導入を加速する方法

>>:  役立つ情報 | 115 行のコードで数独パーサーを作成する方法を段階的に説明します。

ブログ    

推薦する

AIも失業するだろう。スウェーデンの銀行はAIを解雇した

将来自分の仕事が人工知能に置き換えられるのではないかと心配していたら、このニュースはあなたにいくらか...

機械学習は、インダストリー4.0の不安定性、不確実性、複雑性、曖昧性に対処する

序文科学技術の急速な発展により、インダストリアル4.0時代は終焉を迎えつつありますが、実際の発展には...

...

マイクロソフトがAI開発に関する無料電子書籍をリリース、インテリジェントなチャットボットの構築方法を教える

最近、Microsoft は、Microsoft AI プラットフォームを使用してインテリジェントな...

...

求人検索サイトIndeedの統計:AI採用は減速、求職者の関心は低下

6月末、わが国各省市で大学入試結果が次々と発表される中、学生の専攻選択は統計的な傾向に新たな波を起こ...

人工知能が「人工知能」にならないようにするための鍵は、まだ人間の脳にあるかもしれない

ペンシルベニア州立大学の研究チームによると、脳内のアストロサイトと呼ばれる細胞の機能を解明し、それを...

人工知能のように製品にユーザーを理解させるにはどうすればよいでしょうか?これらの方法をまとめてみました!

ほとんどの人は、ロボットやアプリケーション ツールについて話すときにインテリジェンスについて言及しま...

...

AIチャットボットがコロナウイルスによる人員不足の問題を緩和する方法

人工知能 (AI) の最も魅力的な利点の 1 つは、人々がより多くのタスクを達成できるように支援でき...

スマートグリッドの重要性は何ですか?

スマートグリッドは私たちにとってどのような意義があるのでしょうか?実際のところ、私たちはスマートグリ...

人工知能プラットフォームソリューションにおける品質エンジニアリング設計

翻訳者 | 朱 仙中校正:孫淑娟導入私たちは人工知能の黄金時代にいます。 AI ソリューションを導入...

...

大きなモデルには画像がラベル付けされるので、簡単な会話だけで十分です。清華大学とNUSから

マルチモーダル大規模モデルに検出およびセグメンテーション モジュールを統合すると、画像の切り取りが簡...