推奨される 5 つのオープンソースオンライン機械学習環境

推奨される 5 つのオープンソースオンライン機械学習環境

[51CTO.com クイック翻訳] 機械学習は、機械が直接プログラムされることなく学習できるようにする研究分野です。多くの学生、教師、開発者、データ サイエンティストが機械学習を使用してさまざまなプロジェクトや製品を開発しているため、機械学習の開発は急成長しています。ただし、機械学習モデルの開発にはシステム仕様に対する高い要求が課せられ、モデルのトレーニング プロセスには 2 時間から 2 日、あるいはそれ以上かかる場合もあります。そのため、ローエンドのシステムでは機械学習モデルのトレーニングを処理できず、たとえモデルをほとんどトレーニングできなかったとしても、深刻なシステム問題が発生する可能性があります。

[[345808]]

ただし、システム仕様に関する要件がなく、クラウド インフラストラクチャを使用して最短時間でモデルをトレーニングできるオープン ソースの機械学習環境は数多くあります。以下に、効率的で一般的に使用されているオンライン機械学習環境をいくつか示します。

1. Google コラボラトリー

これは、製品やプロジェクトの開発のために Google が提供する、簡単にアクセスできるクラウド サービスです。無料の GPU をサポートし、Jupyter Notebooks 環境に基づいています。 PyTorch、TensorFlow、Keras などの広く使用されているライブラリを使用して、機械学習およびディープラーニング アプリケーションを誰でも構築できるフォーラムを提供します。これにより、システムは機械学習アクティビティのワークロード全体を処理する必要がなくなります。これは、同種のプラットフォームの中で最も成功したものの 1 つです。

  • メモリ - 12 GB ~ 26.75 GB
  • ディスク容量 - 25 GB
  • CPUコア数—2
  • サポートされている言語 - Python

2. IBMワトソン

IBM は、オープンソース ソリューションをサポートする Watson Data Platform と Data Science Experience (DSX) をリリースしました。ついに、データ サイエンスのワークロードに最適なマルチクラウド プラットフォームがリリースされました。これは、Kubernetes によるコンテナ化によって実現されます。したがって、データを保存する Docker または CloudFoundry コンテナーに配布できます。

  • メモリ – 16GB
  • ディスク容量 - 90 GB
  • CPUコア数—4
  • サポートされている言語 - Apache Spark、Python、R、Scala

3. Kaggleカーネル

これは、クラウドでのディープラーニングおよび機械学習アプリケーションに最適なプラットフォームです。 Kaggle と Colab には多くの類似点があり、どちらも Google の製品です。ブラウザで Jupyter Notebook をサポートします。 Jupyter Notebook のキーボード ショートカットの多くは、Kaggle とほぼ同じです。 Kaggle には膨大なデータセットと、データ サイエンス スキルの促進、学習、検証に特化した幅広いコミュニティがあります。 Kaggle カーネルでの GPU と TPU の使用にはいくつかの制限があります。

  • メモリ—25GB
  • ディスク容量 - 155 GB
  • CPUコア - 1
  • サポートされている言語 - PythonとR

4. コクラック

これは、コンピューティング、リサーチ、コラボレーション、ドキュメント作成のための仮想オンライン ワークスペースです。これには、さまざまな科学言語の使用、LaTeX、R/knitr、または Markdown でのテキスト作成機能の提供、Web ベースの Linux コンソール、タイムトラベル機能、チャット ルームやコース管理などの Web リソースが含まれます。ただし、ほとんどの機能は有料ユーザーのみが利用できます。

  • メモリ – 16GB
  • ディスク容量 - 20 GB
  • CPUコア数 – 3
  • サポートされている言語: Julia、Octave、Python、SageMath、R Statistics など。

5. マイクロソフト アジュール

Microsoft の Azure Notebooks は機能的には Colab に似ていますが、速度では Colab よりもはるかに優れています。 Azure Notebooks は、ライブラリと呼ばれるリンクされたノートブックのコレクションです。これらのライブラリは、各データ ファイルが 100 MB 未満であれば、データを保存することもできます。 Azure Notebooks は基本的なアプリケーションに適しています。 Azure では 12 か月間の無料サービスのみが提供されます。

  • メモリ—可変
  • ディスク容量 - 可変
  • CPU コア数 – 可変
  • サポートされている言語 - Python、R、F#

原題: オープンソースのオンライン機械学習環境トップ 5、著者: Rituraj Saha

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  MD5アルゴリズムの暗号化プロセス

>>:  さあ、アルゴリズムの複雑さをもう一度理解しましょう!

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

GoogleはAIの訓練のために何億人ものアメリカ人のオンラインデータを盗んだとして集団訴訟に直面している

7月13日、新たな訴訟で、Googleがチャットボット「バード」などの人工知能(AI)製品のトレーニ...

...

ディープラーニングモデルを本番環境に簡単に導入

[51CTO.com クイック翻訳] データから学習し、パターンを識別し、人間の介入を最小限に抑えて...

人工知能とロボットがすべてを変えているのでしょうか?準備はできたか?

[[227859]]ロボットはかつて、製造業の周辺に限定され、スキルや制御された動作を必要としない...

大きなモデルをベンチマークに騙されないでください!テストセットが事前トレーニングにランダムに挿入され、スコアが人為的に高くなり、モデルが愚かになる

「大きなモデルがベンチマークによって台無しにされないようにしてください。」これは、中国人民大学情報学...

音声認識の専門家が奇妙な学生事件によりジョンズ・ホプキンス大学から解雇され、怒ってFacebookを拒否し、中国に移住した

[[274404]] 8月16日、物議を醸していたジョンズ・ホプキンス大学の元教授ダニエル・ポービー...

2030年までにAI/自動化によって消滅する6つの技術職

翻訳者 | ジン・ヤンレビュー | Chonglou現在、人工知能と自動化は急速な発展段階に入ってお...

...

...

...

Google、少量のサンプル学習と会話で記事を書き換えられるAIライティングアシスタントをリリース

[[412579]] 2016 年には、財務報告書に基づいてプレスリリースを書くという、人間と機械に...

...

ソフトウェア業界における破壊的革命: AIはすべてのものを食べるだけでなく、すべてそのものになる

昔々、ソフトウェアが世界を席巻しました。今、AI が残りを消化するためにここにいます。アプリケーショ...