[51CTO.com クイック翻訳] 増え続けるプログラミング言語ライブラリやツールの中から、機械学習モデルの実装に適したものを知りたい場合は、いつでもサポートを受けることができます。 O'Reilly の新しい調査では、主にテクノロジー、金融、ヘルスケア業界の 1,300 人以上が、各社で使用している機械学習テクノロジーを明らかにしました。 この記事では、データ サイエンスの寵児である Python のソフトウェア フレームワークとライブラリ、ビッグ データ プラットフォーム、機械学習パイプラインのあらゆる段階を処理するクラウドベースのサービスについて紹介します。 機械学習(レポートでは AI と呼んでいる)の使用に関しては、ほとんどの企業はまだ評価段階にあり、実装されている最も一般的なツールは「モデルの視覚化」と「自動モデル検索およびハイパーパラメータ調整」用のツールです。 当然のことながら、最も一般的なタイプの機械学習は教師あり学習であり、大量のラベル付きデータを使用して機械学習モデルをトレーニングします。たとえば、ビデオ内の人物を見つけるタスクを担うコンピューター ビジョン モデルは、画像内に人物がいるかどうかを示す注釈が付けられた画像でトレーニングできます。 画像出典: O'Reilly 企業が機械学習に使用していると主張するライブラリ、フレームワーク、ビッグデータ プラットフォーム、クラウド サービスを紹介します。 ソフトウェアライブラリとフレームワーク1. テンソルフロー Google の広く使用されている機械学習フレームワークは、機械学習モデルのトレーニングに必要な数値計算を処理するように設計されており、CPU、GPU、専用チップ (Google のテンソル プロセッシング ユニット (TPU) など) 間でコンピューティング タスクを分割できます。 2. サイキットラーン さまざまな機械学習アルゴリズムを使用したデータマイニングとデータ分析のための人気の Python ライブラリ。 3. ピトーチ TensorFlow などの競合フレームワークよりも簡単に学習でき、機械学習パイプラインのあらゆる段階で使用できるように設計されたオープンソースのディープラーニング フレームワークです。 4. ケラス ニューラル ネットワーク (ディープラーニングの原動力となる脳にヒントを得た数学モデル) を操作するためのこのディープラーニング フレームワークは、競合するフレームワークよりも使いやすいように設計されています。 Keras は Python で記述されており、TensorFlow、Microsoft Cognitive Toolkit (CNTK)、Python ライブラリ Theano で実行できます。 クラウドスイート5. マイクロソフト Azure ML スタジオ この一連のサービスは、企業が Microsoft の Azure クラウド上やネットワークのエッジに近いコンピューティング デバイス上で機械学習モデルを構築、トレーニング、展開できるように設計されています。ツールは、適切な機械学習モデルを識別して調整するプロセスを自動化し、需要に合わせて基盤となるコンピューティングを拡張するのに役立ちます。 6. Google Cloud 機械学習エンジン Azure ML Studio と同様に、Google Cloud Machine Learning Engine も機械学習モデルのトレーニング、評価、チューニング、デプロイのためのツールを提供します。 7. Amazon SageMaker Amazon SageMaker は、機械学習モデルの構築、トレーニング、デプロイのサービスも提供しており、モデルをより迅速かつ低コストで本番環境にデプロイできます。 ビッグデータプラットフォームツール8. H20 これは、分散システム全体で機械学習のワークロードを拡張できるオープンソースのインメモリ プラットフォームです。 このプラットフォームは、最も広く使用されている統計および機械学習アルゴリズムをサポートし、データ サイエンティストが適切な機械学習モデルを識別して調整するのに役立つレベルの自動化を提供するように設計されています。 9. 天才 Prodigy は機械学習モデルのトレーニングと評価のプロセスを簡素化することを目的としており、このツールはデータ サイエンティストがトレーニング データセットに適切に注釈を付けるのに役立ちます。 10. スパークNLP Spark NLP は、インメモリ ビッグ データ プラットフォーム Apache Spark を実行する分散システムで動作するように設計された自然言語処理 (NLP) ライブラリを提供します。 11. OpenAIジム このツールキットは、強化学習のアルゴリズムを開発および比較するために使用されます。強化学習は、望ましい結果につながるアクションに対して報酬を得ることで、ソフトウェア エージェントがタスクの実行方法を学習するタイプの機械学習です。 12. アナリティクス動物園 Analytics Zoo は、さまざまなビッグデータと機械学習のテクノロジーを統合した、いわゆる統合分析および AI プラットフォームです。 このプラットフォームは、Spark、TensorFlow、Keras、ディープラーニング ライブラリ BigDL を統合し、トレーニングと推論のために分散 Hadoop および Spark クラスター全体に機械学習モデルを拡張できます。 13. アレンNLP 自然言語処理の問題に対する新しいディープラーニングモデルの設計と評価のプロセスを簡素化することを目的としています。 このライブラリには、コア NLP 問題と NLP アプリケーション用の高品質モデルのリファレンス実装が含まれています。 14.ライズラボレイ このフレームワークは、分散システム全体で機械学習モデルを実行するために使用され、スケーラブルでありながら高いパフォーマンスとフォールト トレランスを実現します。 原題: 機械学習のための最も人気のあるプログラミング言語フレームワークとツール、著者: Nick Heath [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: 極端なケースによって引き起こされた議論: アルゴリズムがあなたが死にたいと考えた時...
>>: 必要なものを教えていただければ、当社のAIがコードを作成します
映画やテレビ作品では、人工知能による殺人はごく普通のことのように思えますが、結局のところ、それは人間...
現在、私たちは「インターネット+」から「人工知能」への移行を経験しています。人工知能の発展は、技術レ...
大規模モデルの事前トレーニングには膨大な量のコンピューティング リソースとデータが必要となるため、事...
人工知能 (AI) とモノのインターネット (IoT) の登場により、通信およびインターネット技術業...
[[399928]]製造業ではCADが広く使われています。 CAD は、その正確性、柔軟性、高速性に...
「1セット100元で、身分証明書の表裏の写真、身分証明書を持っている写真、うなずいたり首を振ったり口...
本論文では、確率と統計に基づく類似度測定法であるブラウン距離共分散をディープラーニングに初めて導入し...
1月6日、米国国土安全保障省(DHS)は、毎年開催される3回の生体認証技術カンファレンスでマスク着...
近年、我が国の文化産業は人工知能などのハイテクをますます重視しており、文化と技術が深く有機的に融合す...