推奨される 5 つのオープンソースオンライン機械学習環境

推奨される 5 つのオープンソースオンライン機械学習環境

[51CTO.com クイック翻訳] 機械学習は、機械が直接プログラムされることなく学習できるようにする研究分野です。多くの学生、教師、開発者、データ サイエンティストが機械学習を使用してさまざまなプロジェクトや製品を開発しているため、機械学習の開発は急成長しています。ただし、機械学習モデルの開発にはシステム仕様に対する高い要求が課せられ、モデルのトレーニング プロセスには 2 時間から 2 日、あるいはそれ以上かかる場合もあります。そのため、ローエンドのシステムでは機械学習モデルのトレーニングを処理できず、たとえモデルをほとんどトレーニングできなかったとしても、深刻なシステム問題が発生する可能性があります。

[[345808]]

ただし、システム仕様に関する要件がなく、クラウド インフラストラクチャを使用して最短時間でモデルをトレーニングできるオープン ソースの機械学習環境は数多くあります。以下に、効率的で一般的に使用されているオンライン機械学習環境をいくつか示します。

1. Google コラボラトリー

これは、製品やプロジェクトの開発のために Google が提供する、簡単にアクセスできるクラウド サービスです。無料の GPU をサポートし、Jupyter Notebooks 環境に基づいています。 PyTorch、TensorFlow、Keras などの広く使用されているライブラリを使用して、機械学習およびディープラーニング アプリケーションを誰でも構築できるフォーラムを提供します。これにより、システムは機械学習アクティビティのワークロード全体を処理する必要がなくなります。これは、同種のプラットフォームの中で最も成功したものの 1 つです。

  • メモリ - 12 GB ~ 26.75 GB
  • ディスク容量 - 25 GB
  • CPUコア数—2
  • サポートされている言語 - Python

2. IBMワトソン

IBM は、オープンソース ソリューションをサポートする Watson Data Platform と Data Science Experience (DSX) をリリースしました。ついに、データ サイエンスのワークロードに最適なマルチクラウド プラットフォームがリリースされました。これは、Kubernetes によるコンテナ化によって実現されます。したがって、データを保存する Docker または CloudFoundry コンテナーに配布できます。

  • メモリ – 16GB
  • ディスク容量 - 90 GB
  • CPUコア数—4
  • サポートされている言語 - Apache Spark、Python、R、Scala

3. Kaggleカーネル

これは、クラウドでのディープラーニングおよび機械学習アプリケーションに最適なプラットフォームです。 Kaggle と Colab には多くの類似点があり、どちらも Google の製品です。ブラウザで Jupyter Notebook をサポートします。 Jupyter Notebook のキーボード ショートカットの多くは、Kaggle とほぼ同じです。 Kaggle には膨大なデータセットと、データ サイエンス スキルの促進、学習、検証に特化した幅広いコミュニティがあります。 Kaggle カーネルでの GPU と TPU の使用にはいくつかの制限があります。

  • メモリ—25GB
  • ディスク容量 - 155 GB
  • CPUコア - 1
  • サポートされている言語 - PythonとR

4. コクラック

これは、コンピューティング、リサーチ、コラボレーション、ドキュメント作成のための仮想オンライン ワークスペースです。これには、さまざまな科学言語の使用、LaTeX、R/knitr、または Markdown でのテキスト作成機能の提供、Web ベースの Linux コンソール、タイムトラベル機能、チャット ルームやコース管理などの Web リソースが含まれます。ただし、ほとんどの機能は有料ユーザーのみが利用できます。

  • メモリ – 16GB
  • ディスク容量 - 20 GB
  • CPUコア数 – 3
  • サポートされている言語: Julia、Octave、Python、SageMath、R Statistics など。

5. マイクロソフト アジュール

Microsoft の Azure Notebooks は機能的には Colab に似ていますが、速度では Colab よりもはるかに優れています。 Azure Notebooks は、ライブラリと呼ばれるリンクされたノートブックのコレクションです。これらのライブラリは、各データ ファイルが 100 MB 未満であれば、データを保存することもできます。 Azure Notebooks は基本的なアプリケーションに適しています。 Azure では 12 か月間の無料サービスのみが提供されます。

  • メモリ—可変
  • ディスク容量 - 可変
  • CPU コア数 – 可変
  • サポートされている言語 - Python、R、F#

原題: オープンソースのオンライン機械学習環境トップ 5、著者: Rituraj Saha

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  MD5アルゴリズムの暗号化プロセス

>>:  さあ、アルゴリズムの複雑さをもう一度理解しましょう!

ブログ    
ブログ    

推薦する

人工知能業界における「人材獲得競争」をどう打破するか?

人材不足により人工知能業界全体の給与水準が上昇しており、有名企業の多くが「年俸13倍」「年俸15倍」...

年齢を測るAI顔認識

Instagramは、顔をスキャンして年齢を推定できるサードパーティ企業Yotiが開発したAIツール...

2024年の人工知能とデジタルツインの開発動向

人工知能 (AI) とデジタル ツインは、複数の業界で重要な用途を持つ、よく議論される 2 つの技術...

北京大学の学部生がチップ研究で世界大会で優勝!筆頭著者はトップクラスのEDAカンファレンスで8本の論文を発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2021年、AIは小売業者が失われた顧客ロイヤルティを「救う」のに役立つだろう

2020 年は混乱と混乱が共存しましたが、騒動は落ち着き、小売業者は新年に再編成し、新たな常態に向か...

...

中国は人工知能研究で米国を追い越している

米スタンフォード大学の報告によると、2020年の学術誌におけるAI関連論文の引用率は中国が20.7%...

機械学習に基づく自動文書ラベル付けグラフ技術

このコースでは、ナレッジグラフ技術の開発動向、機械学習に基づくラベルグラフ技術のアイデア、主要技術の...

人工知能とビッグデータの違い

人工知能とビッグデータは人々がよく知っている流行語ですが、混乱が生じることもあります。 AI とビッ...

調査と市場:2025年までに世界のヘルスケア人工知能市場は272億ドルに達する

市場調査会社リサーチ・アンド・マーケッツが最近発表したレポートによると、人工知能の世界のヘルスケア市...

...

人工知能を扱うなら必ず知っておくべき音声認識技術の原理

人工知能の急速な発展に伴い、音声認識は多くのデバイスの標準機能になり始めています。音声認識はますます...