民主化と自動化: 機械学習の参入障壁を下げる 6 つのツール

民主化と自動化: 機械学習の参入障壁を下げる 6 つのツール

かつて、機械学習という用語は科学的な光輪に包まれており、複雑なアルゴリズムにデータを「入力」して有用な分析結果を生成する方法を知っているのは、高給取りのデータ サイエンティストのほんの一握りだけでした。しかし現在では、自動化ツールの急速な発展により、データの収集、構造化、分析が容易になり、機械学習を利用するための敷居は大幅に下がりました。プログラミングを理解していないビジネス担当者でも、適切な質問をすることができれば、機械学習ツールを使用して目的の結果を得ることができます。

[[276055]]

機械学習の民主化が加速しています。その兆候の 1 つとして、最近 AutoML がホットワードになっていることが挙げられます。いわゆる AutoML は、機械学習アルゴリズムに自動化されたメタ レイヤーを追加します。これまで、機械学習アルゴリズムの複雑さは、多数のオプションとパラメータ設定を「微調整」する必要があることに起因しており、データ サイエンティストのエネルギーの 80 ~ 99% がこれに費やされていました。 AutoML は多数のパラメータを自動的にテストおよび調整できるため、アルゴリズムの使用のハードルが大幅に下がるだけでなく、アルゴリズムの調整プロセスも高速化されます。

AutoML は、クラウド内の十分なマシン コンピューティング パワーを利用して、並列で処理し、結果を返すことができるため、クラウド コンピューティングに最適です。同時に、AutoML は、機械学習の初心者が機械学習アプリケーションを段階的に独自に探索するのにも最適です。

機械学習を簡単にする6つのツール

次の 6 つの機械学習ツールは、プログラミングやデータ サイエンスの専門家にならなくても、数字、スプレッドシート、データを扱うすべての人に機械学習の世界への扉を開きます。

1. スプランク

Splunk は、Web アプリケーションによって作成された大量のログ ファイルを検索 (または「スヌーピング」) するための検索ツールとして始まりました。現在では、あらゆる形式のデータ、特に時系列やその他の順次生成されるデータを分析できるツールへと進化しています。 Splunk は、データ分析結果を複雑なビジュアルダッシュボードに表示できます。

最新の Splunk リリースには、TensorFlow などの機械学習ツールや優れた Python オープンソース ツールとデータ ソースを統合するためのアプリが含まれています。外れ値の検出、異常のラベル付け、将来の値の予測の生成のための高速なソリューションを提供します。これらは、非常に大規模なデータセットの干し草の山から針を見つけるために最適化されています。

2. データロボット

DataRobot 内のスタックは、R、Python、またはその他のプラットフォームで記述された優れたオープンソースの機械学習ライブラリのコレクションです。 DataRobot には、パイプラインを設定するためのフローチャートのようなツールを表示する Web インターフェースがあります。 DataRobot は、ローカル データベース、クラウド データ ストア、ダウンロードしたファイルやスプレッドシートなど、すべての主要なデータ ソースに接続します。構築するパイプラインは、データをクリーンアップし、欠損値を埋めてから、外れ値にフラグを立てて将来の値を予測するモデルを生成します。

DataRobot は、特定の予測が行われた理由について「人間にわかりやすい説明」を提供することも試みます。これは、AI の仕組みを理解するのに役立つ機能です。

クラウドとオンプレミスのソリューションのハイブリッド シナリオに展開できます。クラウド実装では共有リソースを通じて最大限の並列処理とスループットを実現できる一方、ローカルインストールではより高いプライバシーと制御が実現します。

3. 水

H2O は、さまざまな機械学習ソリューションを探索するために使用できる自動化スタックである「無人 AI」として自らを位置付けています。データ ソース (データベース、Hadoop、Spark など) を接続し、さまざまなパラメータを使用してさまざまなアルゴリズムに入力します。特定のタスクに割り当てられる時間とコンピューティング リソースの量を制御し、予算内でさまざまなパラメータの組み合わせをテストできます。ダッシュボードまたは Jupyter ノートブックを通じて結果を調査および監査することもできます。

H2O のコアとなる機械学習アルゴリズムと Spark などのツールとの統合はオープンソースですが、いわゆる「ドライバーレス」オプションは、技術サポートが提供されるエンタープライズ顧客に販売される独自のパッケージの 1 つです。

4. ラピッドマイナー

RapidMiner エコシステムの中核は、データ分析用の視覚的なアイコンに基づいたスタジオ ソフトウェアです。ユーザーはアイコンをドラッグ アンド ドロップするだけでパイプラインを生成し、データのクリーニングを行い、さまざまな統計アルゴリズムを実行することができます。従来のデータ サイエンスの代わりに機械学習を使用する場合、自動モデルはさまざまな分類アルゴリズムから選択し、最適なものが見つかるまでさまざまなパラメーターを検索します。このツールの目的は、何百ものモデルを生成し、その中から最適なモデルを決定することです。

モデルを作成した後、ツールはモデルを展開しながら成功率をテストし、モデルがどのように決定を下したかを説明します。ビジュアル ワークフロー エディターを使用して、さまざまなデータ フィールドに対する感度をテストおよび調整できます。

最近の機能強化には、テキスト分析の改善、ビジュアルダッシュボードを構築するためのさまざまなグラフ、時系列データを分析するためのより洗練されたアルゴリズムなどが含まれます。

5. ビッグML

BigML ダッシュボードは、より複雑な機械学習作業の基礎となるデータの相関関係を識別するためにデータ サイエンスで一般的に使用される基本ツールを提供します。たとえば、Deepnets は、より高度なニューラル ネットワークをテストおよび最適化するための高度なメカニズムを提供します。標準化された比較フレームワークを使用してモデルの品質を他のアルゴリズムと比較できるため、従来のデータ サイエンスとより洗練された機械学習のどちらかを選択できます。

BigML のダッシュボードはブラウザで実行され、その分析は BigML クラウドまたはサーバー ルームで実行できます。クラウド バージョンは早期テストを促進するために価格が低く設定されており、無料レベルもあります。コストは主にデータセットのサイズと、利用できるコンピューティング リソースの量によって決まります。無料利用枠では、最大 2 つのプロセスを並行して実行して、最大 16 MB のデータを分析します。小規模な有料アカウントは月額わずか 30 ドルと非常にリーズナブルですが、リソースのニーズが増加するとコストも増加します。

6. Rスタジオ

R は非プログラマーにとって使いやすいものではありませんが、ハードコアなデータ サイエンティストの間で非常に人気があるため、複雑な統計分析のための最も重要なツールの 1 つとなっています。 R Studio は、内部で実行されている R レイヤーとの対話を容易にするための一連のメニューとポイント アンド クリック オプションをユーザーに提供するツールです。

R Studio を使用すると、スプレッドシートを扱うことができる上級管理者は、最も単純なオプションを使用して基本的な分析や複雑な分析も実行できます。 R Studio の一部は一般ユーザーにとってまだわかりにくい部分もありますが、R Studio はオープンになり、時間を投資する意思のあるすべての人にとってアクセスしやすくなりつつあり、最先端のツールを試してみたい人にとっては試してみる価値があります。

<<:  今日のAIの優れた使用例

>>:  5G、人工知能、音声技術…2020年に注目すべき6つのテクノロジートレンド

ブログ    

推薦する

Metaは14秒でビデオを再構築し、役割を変更できるため、ビデオ合成が44倍高速化されます。

今日の人工知能の発展レベルを考えると、テキストから画像への転送、画像からビデオへの転送、画像/ビデオ...

...

人工知能は教育にどのように活用されていますか?ここに実際の例をいくつか示しますので、ぜひご覧ください。

教育者、心理学者、親たちが、子どもがスクリーンを見る時間の長さについて議論する一方で、人工知能や機械...

AIテクノロジーが業界のアップグレードを促進 WOT2018グローバル人工知能テクノロジーサミットがインテリジェントな未来を推進

[51CTO.comからのオリジナル記事] 2018年、人工知能は人類が未来を創造するための最も輝か...

...

未来:ビッグデータとAIがあなたをより深く理解する

今の時代の発展は本当に速すぎます、それを今実感していただけると思います。 3G から 4G、そして ...

機械学習モデルを使用して数十億のデータポイントの性別を予測する方法

[[327734]]ユーザーポートレートに基づいた広告は、広告効果を最適化し、精密なマーケティングを...

...

...

...

軽量ディープラーニングフレームワーク Tinygrad

Tinygrad は、ニューラル ネットワークを理解して実装するためのシンプルで直感的なアプローチ...

...

2019年のトップ10テクノロジートレンドは刺激的だ

2019年もすでに半分が過ぎました。今年上半期のテクノロジー業界の目覚ましい成果は何でしょうか?今日...

人工知能に適したプログラミング言語はどれですか? ——人工知能におけるPythonの役割

Google の AI が囲碁の名人に勝利したことは、人工知能の突然かつ急速な進歩を測る手段であり、...

...