推奨される 5 つのオープンソースオンライン機械学習環境

推奨される 5 つのオープンソースオンライン機械学習環境

[51CTO.com クイック翻訳] 機械学習は、機械が直接プログラムされることなく学習できるようにする研究分野です。多くの学生、教師、開発者、データ サイエンティストが機械学習を使用してさまざまなプロジェクトや製品を開発しているため、機械学習の開発は急成長しています。ただし、機械学習モデルの開発にはシステム仕様に対する高い要求が課せられ、モデルのトレーニング プロセスには 2 時間から 2 日、あるいはそれ以上かかる場合もあります。そのため、ローエンドのシステムでは機械学習モデルのトレーニングを処理できず、たとえモデルをほとんどトレーニングできなかったとしても、深刻なシステム問題が発生する可能性があります。

[[345808]]

ただし、システム仕様に関する要件がなく、クラウド インフラストラクチャを使用して最短時間でモデルをトレーニングできるオープン ソースの機械学習環境は数多くあります。以下に、効率的で一般的に使用されているオンライン機械学習環境をいくつか示します。

1. Google コラボラトリー

これは、製品やプロジェクトの開発のために Google が提供する、簡単にアクセスできるクラウド サービスです。無料の GPU をサポートし、Jupyter Notebooks 環境に基づいています。 PyTorch、TensorFlow、Keras などの広く使用されているライブラリを使用して、機械学習およびディープラーニング アプリケーションを誰でも構築できるフォーラムを提供します。これにより、システムは機械学習アクティビティのワークロード全体を処理する必要がなくなります。これは、同種のプラットフォームの中で最も成功したものの 1 つです。

  • メモリ - 12 GB ~ 26.75 GB
  • ディスク容量 - 25 GB
  • CPUコア数—2
  • サポートされている言語 - Python

2. IBMワトソン

IBM は、オープンソース ソリューションをサポートする Watson Data Platform と Data Science Experience (DSX) をリリースしました。ついに、データ サイエンスのワークロードに最適なマルチクラウド プラットフォームがリリースされました。これは、Kubernetes によるコンテナ化によって実現されます。したがって、データを保存する Docker または CloudFoundry コンテナーに配布できます。

  • メモリ – 16GB
  • ディスク容量 - 90 GB
  • CPUコア数—4
  • サポートされている言語 - Apache Spark、Python、R、Scala

3. Kaggleカーネル

これは、クラウドでのディープラーニングおよび機械学習アプリケーションに最適なプラットフォームです。 Kaggle と Colab には多くの類似点があり、どちらも Google の製品です。ブラウザで Jupyter Notebook をサポートします。 Jupyter Notebook のキーボード ショートカットの多くは、Kaggle とほぼ同じです。 Kaggle には膨大なデータセットと、データ サイエンス スキルの促進、学習、検証に特化した幅広いコミュニティがあります。 Kaggle カーネルでの GPU と TPU の使用にはいくつかの制限があります。

  • メモリ—25GB
  • ディスク容量 - 155 GB
  • CPUコア - 1
  • サポートされている言語 - PythonとR

4. コクラック

これは、コンピューティング、リサーチ、コラボレーション、ドキュメント作成のための仮想オンライン ワークスペースです。これには、さまざまな科学言語の使用、LaTeX、R/knitr、または Markdown でのテキスト作成機能の提供、Web ベースの Linux コンソール、タイムトラベル機能、チャット ルームやコース管理などの Web リソースが含まれます。ただし、ほとんどの機能は有料ユーザーのみが利用できます。

  • メモリ – 16GB
  • ディスク容量 - 20 GB
  • CPUコア数 – 3
  • サポートされている言語: Julia、Octave、Python、SageMath、R Statistics など。

5. マイクロソフト アジュール

Microsoft の Azure Notebooks は機能的には Colab に似ていますが、速度では Colab よりもはるかに優れています。 Azure Notebooks は、ライブラリと呼ばれるリンクされたノートブックのコレクションです。これらのライブラリは、各データ ファイルが 100 MB 未満であれば、データを保存することもできます。 Azure Notebooks は基本的なアプリケーションに適しています。 Azure では 12 か月間の無料サービスのみが提供されます。

  • メモリ—可変
  • ディスク容量 - 可変
  • CPU コア数 – 可変
  • サポートされている言語 - Python、R、F#

原題: オープンソースのオンライン機械学習環境トップ 5、著者: Rituraj Saha

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  MD5アルゴリズムの暗号化プロセス

>>:  さあ、アルゴリズムの複雑さをもう一度理解しましょう!

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

...

人工知能技術は子供たちにどのような影響を与えるのでしょうか?

人工知能技術は、おもちゃ、オンライン アプリケーション、ビデオ ゲームに組み込まれています。AI ア...

指紋と顔の認識が手のひらスキャンにアップグレードされ、大ヒット映画でしか見られない新技術がシティエキスポでデビュー

[[250312]]手のひらをスワイプするだけで入場や支払いができ、道路清掃車にセンサーを追加するこ...

...

マイクロソフトリサーチアジア、ウェイ・フル氏:人工知能における基礎イノベーションの第2次成長曲線

人工知能の発展の観点から見ると、GPT シリーズのモデル (ChatGPT や GPT-4 など) ...

ジャック・マー氏がまたもや的を射た発言:「将来、住宅はタマネギのように安くなる」のは固定資産税ではなく人工知能のせい?

「家はタマネギのように安くなる」というのは、家を買う余裕のないすべての人にとっての将来のビジョンな...

...

4つの業界は人工知能がもたらす混乱に注意を払う必要がある

2020 年には、AI と機械学習のテクノロジーが新興産業に継続的な影響を与え、企業だけでなく消費者...

毎日のアルゴリズム: 回転マトリックス

[[431855]]各ピクセルのサイズが 4 バイトである N × N 行列で表される画像が与えられ...

...

...

2000年以降の大学生が伝染病と戦うロボットを設計

「私たちのロボット戦車は防疫ロボットに転用できるだろうか?」疫病流行の期間中、山東科技大学の学生たち...

...

人工知能の台頭は難しく、普通のAI開発者が普及する

[[241542]] Forbes によれば、FORTRAN のパンチカードから Go を使用した分...