Keras よりも優れた機械学習「モデル パッケージ」: コード 0 個でモデルの作成を開始

Keras よりも優れた機械学習「モデル パッケージ」: コード 0 個でモデルの作成を開始

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習モデルを作るとき、さまざまなアルゴリズムを統合するだけで脳細胞を使い果たしてしまったことはありませんか?

それとも、データの前処理は「時間の無駄」だとお考えですか?

ゲッティンゲン大学を卒業し、機械学習に取り組んでいる男性もこの問題を発見しました。彼は当初、モデルを設計したいだけだったのですが、「実装の方が設計よりも面倒」であることが判明しました。

そこで彼は、 igel (ドイツ語で「ハリネズミ」を意味しますが、Init、Generate、Evaluate Machine Learning の略でもあります) というプロジェクトを作成しました。これにより、追加のコードを記述せずに目的のモデルを設計できるようになりました。

[[344828]]

つまり、ユーザーはさまざまな機械学習モデルの原理を知っておくだけでよく、自分でコードを書く必要はありません。

Keras と比較すると、このプロジェクトでは前処理、入力、出力の作業がさらに簡素化され、「モデル パッケージ」と同じくらいシンプルになっています。

作者はプロジェクトのバージョン 1.0 の制作に 2 週間を費やしましたが、このバージョンは 1 日で 842 個のスターを獲得し、現在も急速に人気が高まっています。

まだバージョン 1.0 なので、このプロジェクトにはまだ改善の余地がたくさんあると作者は述べています。

しかし、現時点では、基本的な機械学習モデリングには十分です。

「機械学習の制作を自動化する」

このプロジェクトを立ち上げた著者の当初の意図は、機械学習モデルをすべての人に提供することでした。

技術エンジニアであっても、他の業界の非技術ユーザーであっても、機械モデルを使用すると作業が容易になります。

簡単に言えば、機械学習を「自動化」プロセスに変えるということであり、彼はそれをそのように設計しました。

igel プロジェクトには最新の機械学習モデル (回帰、分類、クラスタリング) がすべて含まれており、作者によるとプロジェクトは現在も更新中とのことです。

つまり、将来的に新しい機械学習モデルが登場すれば、それがプロジェクトに追加されることになります。

このモデルは現在、次の機能をサポートしています。

最新の機械学習モデルをすべてサポート(プレビューモデルも含む)

さまざまなデータ前処理方法をサポート

構成を記述する際に柔軟性とデータ制御を提供します

クロス検証をサポート

yaml および json 形式をサポート

回帰、分類、クラスタリングのためのさまざまなsklearnメトリックのサポート

マルチ出力/マルチターゲット回帰と分類をサポート

マルチ処理並列モデル構築をサポート

作者は怠けるために機械学習の制作をシンプルにすることに多大な労力を費やしたことがわかります。

始めるのはとても簡単です。

「モデルパック」を使い始めるための6つのステップ

他のプログラムと同様に、このプログラムには「ヘルプ」メニューが用意されています。使用方法を知るには、「igel -h」(または igel -help) と入力するだけです。

使い方を学んだら、yaml 形式または json 形式の設定ファイルの作成を開始できます。

怠け者(著者のような)の場合は、「igel init」を使用して初期化できます。

例えば、病気かどうかを判定する機能の設定ファイルを作りたい場合:

最初のステップは、関数、モデル、ターゲットを選択することです: igel init -type "classification" -model "NeuralNetwork" -target "sick"

2番目のステップは初期化です: igel init

次に、プログラムは構成ファイルを生成し、必要に応じて変更します。

その後は、特定のアルゴリズム パラメータを選択し、選択したデータセットを提供するだけです。

たとえば、ランダム フォレストを使用してデータを処理する場合は、システムにパラメーター (およびデータセットと構成ファイルのパス) を提供するだけで、次のトレーニングが可能になります。

さらに、モデル/事前トレーニング済みモデルを評価することもできます。

気分はいいですか?予測モデルを生成します。

直接使用します:

わずか 6 つの簡単な手順で、マシン モデル (プレビュー モデル) が生成されるので、非常に便利です。

ネットユーザー:素晴らしい、もっと新しい機能が欲しい

また、著者はネットユーザーの意見を採用することにも非常に満足しています。

たとえば、あるユーザーは、クロスバリデーションをハイパーパラメータの検索/チューニングに使用できれば大きな改善になると指摘し、著者はすぐにこの提案を採用しました。

しかし、ネットユーザーの中には「すべての手続きを自動化する」のは無意味だとの声も上がっている。

結局のところ、作者はプロジェクトが scikit-learn 上に構築されていると述べています。しかし、後者はわずか数行のコードで機械学習を行うこともできます。では、scikit-learn とこのプロジェクトの違いは何でしょうか?

著者は、最大の違いは、コードを書くことと比較して、このプロジェクトでは、望ましいモデルをより「読みやすい」方法で設計することを目指している点であると答えました。

一部のネットユーザーはこの見解に同意しています。結局のところ、生産現場で働く多くの機械学習エンジニアにとって、「行う必要のないプログラミング作業」は無意味であり、「時間とお金の無駄」なのです。

より多くのネットユーザーがこのプロジェクトへの支持を表明し、その新機能を期待している。

この機械学習プロジェクトに興味のある方は、以下のポータルからチェックしてみてください〜

著者について

[[344830]]

Nidhal Baccouri 氏は今年 4 月にドイツのゲッティンゲン大学で修士号を取得し、ソフトウェア、制御工学、人工知能を研究対象としています。

現在、Nidhal Baccouri は自動車業界で働いており、人工知能とモノのインターネットの知識を応用したデジタルツイン技術に重点を置いています。彼は余暇には、特に AI と Python に関連するプロジェクトに取り組むのが好きです。

ポータル

プロジェクトアドレス:
https://github.com/nidhaloff/igel

<<:  絶対に対立なんかじゃない!短期的にはAIが人間に取って代わることができない5つの分野

>>:  人工知能は第4世代に入り、人工直感が開発の次のステップとなる

ブログ    
ブログ    
ブログ    

推薦する

専門家レベルの機械学習ツールの推奨事項。専門家と同じものを入手しましょう。

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

ディープラーニング + OpenCV、Python でリアルタイムのビデオ オブジェクト検出を実現

OpenCV と Python を使用してライブ ビデオ ストリームでディープラーニング オブジェク...

Javaコードの効率とアルゴリズム設計を最適化してパフォーマンスを向上

Java 開発では、非効率的なコードや不合理なアルゴリズムにより、プログラムのパフォーマンスが低下す...

コードを知らなくても機械学習を実現できますか?

ローコード プラットフォームは、アプリケーション、統合、およびデータの視覚化の開発の速度と品質を向上...

人工知能をうまく実装するにはどうすればよいでしょうか?

人工知能 (AI) と機械学習 (ML) は、ビジネスの流行語から、より広範な企業での導入へと移行し...

...

...

はい、純粋なSQLクエリステートメントでニューラルネットワークを実装できます。

[[229220]]よく知られているように、SQL は、開発者が大量のデータに対して効率的な操作を...

...

2018 年後半のディープラーニング プロジェクトをお見逃しなく!

[[252582]]ビッグデータダイジェスト制作翻訳者:fuma、Ni Ni、Jiang Baos...

2019年に解決すべき11のAI倫理的ジレンマ

ビッグデータダイジェスト制作編集者: Luan Hongye、Aileen今こそAIの倫理について議...

清華大学の学生が強化学習プラットフォーム「TianShou」を開発:数千行のコードが完成、オープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

「宝くじ仮説」の著者による新しいPyTorchライブラリは人気があり、モデルのトレーニングが2〜4倍高速化されます。

さまざまなタスクに人工知能を導入する企業が増えるにつれ、AI モデルのトレーニングはコストがかかり、...