Microsoft、Spark 向けディープラーニング ライブラリ MMLSpark をオープンソース化

Microsoft、Spark 向けディープラーニング ライブラリ MMLSpark をオープンソース化

[[207730]]

Microsoft は、Apache Spark 用のディープラーニング ライブラリである MMLSpark をオープンソース化しました。 MMLSpark は、Microsoft Cognitive Toolkit および OpenCV と完全に統合できます。

Microsoft は、SparkML はスケーラブルな機械学習プラットフォームを構築できるものの、ほとんどの開発者が基盤となる API の呼び出しに労力を費やしていることを発見しました。 MMLSpark は、PySpark での反復タスクを簡素化することを目的としています。

UCI 成人所得国勢調査データセットを例に、他の項目を使用して所得を予測できます。

SparkML を直接使用する場合は、各列を個別に処理し、正しいデータ型に整理する必要があります。MMLSpark では、これには 2 行のコードのみが必要です。

  1. モデル = mmlspark.TrainClassifier(モデル=LogisticRegression(), ラベルCol=”income”).fit(trainData)
  2.  
  3. 予測 = model.transform(テストデータ)

ディープニューラルネットワーク(DNN)は、画像認識や音声認識などの分野では人間と同等の能力を持っていますが、DNNモデルのトレーニングには専門家が必要であり、SparkMLとの統合も非常に困難です。 MMLSpark は、DNN アルゴリズムの簡単なトレーニングに便利な Python API を提供します。 MMLSpark は、分類タスクに既存のモデルを簡単に使用し、分散 GPU ノードでトレーニングし、OpenCV を使用してスケーラブルな画像処理パイプラインを構築できます。

次の 3 行のコードで、Microsoft Cognitive Toolset の DNN モデルを初期化し、画像から特徴を抽出できます。

  1. cntkModel = CNTKModel().setInputCol("images").setOutputCol("features").setModelLocation(resnetModel).setOutputNode("zx")
  2.  
  3. featureizedImages = cntkModel.transform(imagesWithLabels) .select (['labels','features'])
  4.  
  5. モデル = TrainClassifier(モデル = LogisticRegression(),labelCol="labels").fit(featurizedImages)

MMLSpark は Docker Hub にリリースされており、次のコマンドを使用して単一のマシンにデプロイできます。

  1. docker run -it -p 8888:8888 -e ACCEPT_EULA=yes microsoft/mmlspark

MMLSpark は MIT ライセンスに基づいてライセンスされています。

<<:  AI に「大きな力と小さな心」を与える - ユニバーサル CNN アクセラレーション設計

>>:  新しいAIシステムが地震を正確に予測できるようになりました

ブログ    
ブログ    
ブログ    

推薦する

AIはサイバーセキュリティにおいて人間に取って代わるでしょうか?両者は対立していない

近年、サイバーセキュリティ業界では人工知能技術が話題になっています。セキュリティ オーケストレーショ...

...

データだけ? 2018 年の AI 予測トップ 5

[[213487]] 2017年、人工知能(AI)は職場でも家庭でも、ほとんどの人々の日常生活の一...

...

...

...

会話型AIチャットボットの成功を測定する方法

[[385791]] 【51CTO.com クイック翻訳】組織は、特にヘルスケア分野において、データ...

BAIRは、3種類のモデルフリー強化学習アルゴリズムを組み合わせたRLコードライブラリrlpytをオープンソース化しました。

最近、BAIR は強化学習研究コードライブラリ rlpyt をオープンソース化しました。このライブラ...

重要なポイントを強調します。最大2億元の支援、AIイノベーション開発パイロットゾーンの5つの重点政策を理解する

[[344168]] 2019年8月、科学技術部は「国家新世代人工知能イノベーション開発パイロットゾ...

グラフディープラーニングで複雑な研究​​タイプのタスクを実装するのは、あまりにも面倒ですか?この新しいツールキットは、

ディープラーニングは、AI分野で最も注目されている分野の1つです。現在、PyGやDGLなどの主流のグ...

Lightning AI Studioを無料で使う方法

翻訳者 |ブガッティレビュー | Chonglouこの記事では、無料で使いやすい新しいクラウドIDE...

人工知能のシンギュラリティに関する考察: 超知能 AI の倫理的問題は無視できない

ロボットの電源を切ったり、人工知能アルゴリズムをオフにしたりするのは悲しいですか? まだそうではあり...

人工知能の先駆者であるIBM Watsonは殉教者となったのか? IBMがWatsonを売却、AIは本当に失敗したのか?

かつて、人工知能医療診断の先駆者であったIBM Watson(通称ワトソン)は、現実世界における人工...