Angel: 新しい分散型機械学習システム

Angel: 新しい分散型機械学習システム

Angel は、パラメータ サーバーの概念に基づいた分散型機械学習フレームワークであり、機械学習アルゴリズムを高次元モデル上で簡単に実行できます。 Angel はモデル共有という中核概念に焦点を当て、大規模な高次元モデルを複数のパラメータ サーバー ノードに合理的に分割し、効率的なモデル更新インターフェイス、操作機能、変数同期プロトコルを通じてさまざまな効率的な機械学習アルゴリズムを実装します。優れた設計のおかげで、Angel は独立して実行でき、さまざまな機械学習アルゴリズムを効率的に実行できるだけでなく、Spark や既存のディープラーニング フレームワークをサポートして高速化する PS サービスとしても機能します。業界からの膨大なデータに基づいて繰り返し実践と調整が行われており、幅広い適用性と安定性を備えています。モデルの次元が高くなるほど、その利点は明らかになります。

既存の機械学習システムは、さまざまな種類の機械学習タスク用に構築されています。データフローシステムの Hadoop と Spark は、一般的なデータ処理タスクや機械学習パイプラインの構築に適していますが、パラメータ共有メカニズムが欠如しており、単一ポイントのボトルネックによるパフォーマンスの問題があります。グラフコンピューティングシステムの GraphLab、GraphX、Tux2 は、機械学習の計算をグラフ構造に抽象化します。グラフ構造の特性を利用して高速化できますが、スパースグラフ構造のアルゴリズムにしか適していません。ディープラーニングシステムの TensorFlow、MXNet、Caffe2 は、パラメータサーバーまたは Allreduce 方式を使用して分散ニューラルネットワークをトレーニングします。これらのシステムの特長は、GPU を使用してニューラルネットワークの計算を高速化できることですが、スパースグラフ構造の最適化とサポートが不足しています。

Angel は、分散機械学習の共通性を設計において抽象化し、洗練させます。この記事は、分散機械学習の核心部分はパラメータ共有にあると考えています。効率的なパラメータ共有メカニズムを提供できれば、さまざまな機械学習タスクを拡張し、加速することができます。そのため、Angel は PS サービス機能を提供し、2 つの動作モードをサポートします。モードの 1 つは PS サービス モードと呼ばれ、このモードでは Angel はマスター サーバーとパラメーター サーバーのみを起動し、特定のコンピューティング タスクは他のコンピューティング プラットフォーム (Spark、TensorFlow など) によって完了します。このモードでは、Angel はパラメーター サーバーの機能を提供する役割のみを担います。別のモードでは、Angel はワーカーも起動し、モデルのトレーニングを完了する役割を Angel が担います。 Angel は PS サービス機能を提供し、さまざまな種類の機械学習タスクを処理し、より便利な機械学習開発エクスペリエンスを提供できるようにします。

さらに、Angel は、(1) さまざまなクラスター環境での高速化のための複数のパラメーター同期プロトコル、(2) アルゴリズム開発を容易にする使いやすく豊富なインターフェイス、(3) アルゴリズムのスケーラビリティを向上させるデータ並列処理およびモデル並列処理機能、(4) 複雑な環境でのタスクの動作を保証する効率的なフォールト トレラント メカニズムも提供します。実際のデータセットで比較した結果、複数の機械学習アルゴリズムにおける Angel のパフォーマンスは、XGBoost、Spark、Petuum、TensorFlow などの一般的な機械学習システムよりも優れています。現在、AngelはTencent Videoのクリック予測や広告推奨など実際のビジネスに応用されています。

Angel のオープンソース システムは、北京大学と Tencent の共同イノベーション ラボによって開発されました。業界における高い可用性と学術コミュニティにおけるイノベーションの両方を考慮しています。GitHub で完全にオープンソース化されており、ロジスティック回帰、SVM、KMeans、LDA、MF、GBDT などの複数の機械学習アルゴリズムを統合して最適化します。 Angel は現在 Java と Scala をベースに開発されており、将来的には Python やその他の言語インターフェースが追加され、さらに使いやすくなる予定です。将来的には、Angel の PS サービス機能がさらに活用され、グラフ コンピューティングやディープラーニング フレームワークがサポートされるようになります。

<<:  Ele.meにおける人工知能の応用

>>:  2か月でAIをゼロから学んだ方法とは?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

韓国メディア:中国の技術発展は速すぎて米国を脅かしており、米国から制裁を受けるだろう

[[216638]]韓国メディアは、中国の囲碁棋士である柯潔氏が2018年春にテンセントが開発した人...

人工知能は核爆弾と同じくらい人類にとって脅威なのでしょうか? AI脅威理論の謎を解く

新たに世界一の富豪となり、テスラのCEO、そしてテクノロジー界の大物となったマスク氏は、ロボットが近...

...

中国チームの「6軸セル3Dプリンター」が雑誌でトップに!心筋組織は体外で6ヶ月以上生存する

3Dバイオプリンティング技術は、3Dプリンターを使用して細胞や生物学的材料を含む「インク」を特定の形...

人工知能は良いものだが、企業はAIの適用時に4つの大きな間違いを犯している。

問題は正確には何ですか? これらのエラーを回避する方法はありますか?今日、人工知能 (AI)、機械学...

ホーキング博士が亡くなりました。彼が残した5つの予言をぜひ読んでみてください

ガーディアン紙、BBC、スカイニュースチャンネルなど複数の外部情報源によると、英国の物理学者スティー...

...

FudanNLPチームの最新の成果、RLHFと人間のアラインメントのためのMOSS-RLHFがここにあります

ChatGPT に代表される大規模言語モデル (LLM) がさまざまなタスクで効率的にパフォーマンス...

自動運転には未来があるのでしょうか?

自動運転の定義この記事では、飛行機や船ではなく、自動車の自動運転について説明します。英語ではこれを自...

強化学習を使用して、顧客が注目する広告を選択する方法

[51CTO.com クイック翻訳] 現在、世界中のデジタル広告代理店は、ニュースサイト、検索エンジ...

...

会話型 AI ソリューションを実装する際に避けるべき 7 つの間違い

会話型 AI ソリューションを実装する際によくある 7 つの間違いを見てみましょう。適切な戦略と計画...

...

...