Microsoft、Spark 向けディープラーニング ライブラリ MMLSpark をオープンソース化

Microsoft、Spark 向けディープラーニング ライブラリ MMLSpark をオープンソース化

[[207730]]

Microsoft は、Apache Spark 用のディープラーニング ライブラリである MMLSpark をオープンソース化しました。 MMLSpark は、Microsoft Cognitive Toolkit および OpenCV と完全に統合できます。

Microsoft は、SparkML はスケーラブルな機械学習プラットフォームを構築できるものの、ほとんどの開発者が基盤となる API の呼び出しに労力を費やしていることを発見しました。 MMLSpark は、PySpark での反復タスクを簡素化することを目的としています。

UCI 成人所得国勢調査データセットを例に、他の項目を使用して所得を予測できます。

SparkML を直接使用する場合は、各列を個別に処理し、正しいデータ型に整理する必要があります。MMLSpark では、これには 2 行のコードのみが必要です。

  1. モデル = mmlspark.TrainClassifier(モデル=LogisticRegression(), ラベルCol=”income”).fit(trainData)
  2.  
  3. 予測 = model.transform(テストデータ)

ディープニューラルネットワーク(DNN)は、画像認識や音声認識などの分野では人間と同等の能力を持っていますが、DNNモデルのトレーニングには専門家が必要であり、SparkMLとの統合も非常に困難です。 MMLSpark は、DNN アルゴリズムの簡単なトレーニングに便利な Python API を提供します。 MMLSpark は、分類タスクに既存のモデルを簡単に使用し、分散 GPU ノードでトレーニングし、OpenCV を使用してスケーラブルな画像処理パイプラインを構築できます。

次の 3 行のコードで、Microsoft Cognitive Toolset の DNN モデルを初期化し、画像から特徴を抽出できます。

  1. cntkModel = CNTKModel().setInputCol("images").setOutputCol("features").setModelLocation(resnetModel).setOutputNode("zx")
  2.  
  3. featureizedImages = cntkModel.transform(imagesWithLabels) .select (['labels','features'])
  4.  
  5. モデル = TrainClassifier(モデル = LogisticRegression(),labelCol="labels").fit(featurizedImages)

MMLSpark は Docker Hub にリリースされており、次のコマンドを使用して単一のマシンにデプロイできます。

  1. docker run -it -p 8888:8888 -e ACCEPT_EULA=yes microsoft/mmlspark

MMLSpark は MIT ライセンスに基づいてライセンスされています。

<<:  AI に「大きな力と小さな心」を与える - ユニバーサル CNN アクセラレーション設計

>>:  新しいAIシステムが地震を正確に予測できるようになりました

ブログ    
ブログ    

推薦する

不動産業界における人工知能のメリットトップ10

人工知能 (AI) は不動産業界に革命をもたらし、データ分析の強化から顧客体験の向上まで、さまざまな...

...

2020年の中国の人工知能開発の見通し

人工知能の今後の発展の見通し。中国の人工知能研究は爆発的な成長期にあり、人工知能産業の基礎条件は整っ...

...

この3つのロボットを知っていますか?

ロボットには、人間との感情的なつながりを築くように設計されたフレンドリーなロボットから、複雑なタスク...

指紋、顔、虹彩: 適切な生体認証技術を選択するには?

[[351445]]最近、クレジットカード会社からデータ漏洩に関する連絡がありましたか? あるいは...

人間と機械のコラボレーションが顧客に力を与え、インテリジェントな顧客サービスが企業のマーケティング環境を一変させています。

「ロボットはアフターサービスにしか適していません。」 「ロボットはどのようにして人手によるマーケテ...

3Dタスク(知覚、推論、計画、行動)に精通した初の具現化されたジェネラリストエージェント

汎用人工知能へと進むには、人間の生活の現実世界を理解し、豊富なスキルを習得できる具現化された汎用イン...

NLPの新人プロンプトは円を超えて、清華大学劉志遠の最新論文はそれをVLM画像に適用する

[[426388]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

AI がソフトウェアをテストし、バグを修正できるようになれば、プログラマーの仕事は楽になるのでしょうか?

10月18日のニュース、単純な手作業から複雑な法的判断や医療診断まで、ロボットと人工知能が驚くべき...

...

PyTorch モデルのトレーニングを高速化するための 9 つのヒント!

[[353240]]ニューラルネットワークをこのようにしないでください正直に言えば、あなたのモデル...

フランス企業が世界初のAIスマートミラーを発売。ユーザーの感情を認識し、ストレスを軽減できる

1月8日、CES 2024の期間中、フランスのスマートヘルステクノロジー企業Baracodaが世界初...

Java 配列から HashMap へのアルゴリズムの説明

1. 配列とは何ですか?どの本にこのような文章があったか忘れましたが、「すべてのデータ構造は配列の進...

人工知能技術はますます普及してきています。どの開発言語が優れているのでしょうか?

人工知能産業が台頭から急速な発展へと進む過程において、AIトップ人材の主導的役割は特に重要です。国か...