最近、ByteDanceの応用機械学習チームは、veGiantModelという大規模モデルトレーニングフレームワークをオープンソース化しました。このトレーニングフレームワークは、主に自然言語処理分野の大規模モデルトレーニングに使用され、大規模モデルトレーニングのパフォーマンスを最大6.9倍向上させ、トレーニングシステムへの負荷を大幅に軽減します。現在、ByteDance 傘下のエンタープライズ レベルのテクノロジー サービス プラットフォームである Volcano Engine は、パブリック ベータ版である機械学習プラットフォームで veGiantModel をネイティブにサポートしています。 自然言語処理は、コンピューターが人間の言語を理解、解釈、使用できるようにすることを目的とした人工知能研究の重要な分野です。近年、自然言語処理は、主に BERT、GPT、GPT-3 などの事前トレーニング済み言語モデルの普及により、アプリケーションにおいて大きな進歩を遂げました。事前学習済みの言語モデルは、人工知能の分野ではインフラとなっていると言えます。大規模モデルの方がアルゴリズムのパフォーマンスが優れているため、事前トレーニング済みの言語モデルは近年、大規模モデルへの急速な傾向を示しています。しかし、モデル サイズの急速な増加は、主にメモリの圧力、コンピューティングの圧力、および通信の圧力に反映され、既存のトレーニング システムにかなりの課題をもたらしました。 大規模モデルのトレーニング シナリオにおいて既存のトレーニング システムが直面する上記の課題に対応するため、ByteDance の応用機械学習チームは、大規模モデル トレーニング フレームワーク veGiantModel を提案しました。 veGiantModel の中国語名は Volcano Engine Large Model Training Framework です。これは、オープンソースのディープラーニング フレームワーク PyTorch をベースにした高性能な大規模モデル トレーニング フレームワークであり、2 つの主要なオープンソースの主流トレーニング フレームワークである Megatron と DeepSpeed を基盤として構築されています。 veGiantModel は、データ並列、演算子分割、パイプライン並列の 3 つの分散並列戦略を同時にサポートでき、自動化およびカスタマイズされた並列戦略をサポートします。Byte が開発した高性能非同期通信ライブラリである ByteCCL に基づいて、veGiantModel のトレーニング タスク スループットは、他の主流のオープン ソース フレームワークよりも 1.2 ~ 3.5 倍高く、より使いやすく柔軟なパイプライン サポートを提供し、モデル開発と反復に必要な人員を削減します。さらに、veGiantModel は、数十億から数千億のパラメーターを持つ大規模なモデルを GPU 上で効率的にサポートでき、ネットワーク帯域幅の要件が低く、プライベートに展開する場合に RDMA に大きく依存しません。 MegtraonとDeepSpeedとの比較テストでは、veGiantModelが最も優れたパフォーマンスを発揮し、ネットワーク帯域幅の影響が最も少ないことが示されました。Tesla V100では上記2つよりも1.2~3.5倍、Ampere A100では最大6.9倍のパフォーマンス向上が見られました。 veGiantModel オープンソースアドレス: https://github.com/volcengine/veGiantModel Volcano Engine 機械学習プラットフォーム パブリックベータ アドレス: https://www.volcengine.com/product/ml-platform |
<<: 自動運転トラックはレベル4を達成する可能性が最も高いが、自動運転車は2022年まで待たなければならない
>>: ロボットをもっと速く走らせたい?人工知能で制御しよう
市場調査会社IDCは7月25日、近年の人工知能の急速な進化と発展により、ビッグデータモデルはますます...
2021年、国内の新エネルギー乗用車市場はチップ不足や電池原材料価格の高騰など予想外の事態に見舞わ...
AI、つまり人工知能の新たな波が到来します。機械学習、ディープラーニング、ニューラルネットワーク、音...
ビッグデータダイジェスト制作眼鏡をかければ心臓発作の危険があるかどうかがわかるなんて、驚きですよね?...
一方で感染症の予防と抑制、他方で春節の旅行ラッシュの帰省があり、今年の仕事再開への道のりは異例のもの...
人工知能、機械学習、マシンビジョンとは具体的に何でしょうか?顔認識と人工知能の関係は何でしょうか?人...
今朝、ジャック・マーは自身の微博に「ドイツで開かれたCEBITカンファレンスの開幕式が終わったばかり...
メタの株価は木曜日の時間外取引で14%近く上昇し、史上最高値に達したが、同社は初の配当を発表した。最...
オンラインビデオの読み込み速度と鮮明さに対する人々の要求は常に尽きることがありません。最近、マサチュ...
2021 年には技術変化のペースが加速し、歴史が示すように、2022 年もそのペースは加速し続けるで...
最近、世界インターネット会議で「世界インターネット発展報告書2020」が発表されました。報告書では、...
今回、人工知能アルゴリズムが国際数学オリンピック(IMO)で大きな進歩を遂げました。本日発行された国...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ロボットは長い間、人々の探究心を呼び起こしてきたが、同時に説明のつかない恐怖ももたらしてきた。しかし...