PyCaret: 機械学習モデルの開発が簡単に

PyCaret: 機械学習モデルの開発が簡単に

今日の急速に変化するデジタル世界では、組織はローコード/ノーコード (LC/NC) アプリケーションを使用して、新しい情報システムを迅速に構築します。この記事では、Python で書かれたローコード機械学習ライブラリである PyCaret を紹介します。

PyCaret は、R プログラミング言語の Caret (Classification And REgression Training の略) パッケージの Python バージョンであり、多くの利点があります。

作業効率を向上: PyCaret は、作業効率を向上できるローコード ライブラリです。コーディングに費やす時間が短縮されるため、あなたとあなたのチームはビジネス上の問題に集中できるようになります。

使いやすい:この使いやすい機械学習ライブラリを使用すると、少ないコード行数でエンドツーエンドの機械学習実験を実行できます。

市販: PyCaret は市販のソリューションです。選択したノートブック環境内から迅速かつ効率的にプロトタイプを作成できます。

Python で仮想環境を作成し、次のコマンドを実行して PyCaret のフルバージョンをインストールできます。

 pip インストールpycaret [ フル]

機械学習の専門家は、分類、回帰、クラスタリング、異常検出、自然言語処理、関連ルールマイニング、時系列分析に PyCaret を使用できます。

PyCaret を使用した分類モデルの構築

この記事では、PyCaret のデータ リポジトリから Iris データセットを取得し、PyCaret を使用して分類モデルを構築する方法について説明します。

作業を簡単にするために Google Colab 環境を使用し、以下の手順に従います。

ステップ1

まず、次のコマンドを実行して PyCaret をインストールします。

 pip インストールpycaret

ステップ2

次に、図 2 に示すようにデータセットを読み込みます。

データセットの読み込み

 pycaret.datasets からget_data インポートする
データセット= get_data ( 'iris' )
(または)
pandaspd としてインポートする
データセット= pd.read_csv ('/path_to_data/ file.csv ' )

ステップ3

次に、図 2 に示すように PyCaret 環境を設定します。

PyCaret 環境の設定

 pycaret からの分類インポート*
clf1 = セットアップ( データ= データセットターゲット= '種' )

PyCaret環境設定結果

PyCaret を使用してあらゆるタイプのモデルを構築する場合、環境設定が最も重要なステップです。デフォルトでは、setup() 関数は引数データ (Pandas データフレーム) とターゲット (データセット内のクラス ラベル変数へのポインター) を受け入れます。 setup() 関数の結果を図 3 に示します。デフォルトでは、setup() 関数はデータの 70% をトレーニング セットに、30% をテスト セットに分割し、図 3 に示すようにデータの前処理を実行します。

ステップ4

次に、図 4 に示すように、最適なモデルを見つけます。

最適なモデルを見つける

 ベスト= compare_models ()

デフォルトでは、compare_models() は 10 倍のクロス検証を適用し、図 4 に示すように、より短いトレーニング時間で、さまざまな分類器の精度、AUC、リコール、精度、F1 スコア、カッパ、MCC などのさまざまなパフォーマンス メトリックを計算します。 compare_models() 関数に tubro=True を渡すことで、すべての分類子を試すことができます。

ステップ5

次に、図 5 に示すようにモデルを作成します。

モデルの作成

 lda_model = create_model ( 'lda' )

図 4 に示すように、線形判別分析分類器は良好なパフォーマンスを示しました。したがって、lda を create_model() 関数に渡すことで、モデルを適合させることができます。

ステップ6

次のステップは、図 6 に示すように、モデルを微調整することです。

モデルの調整

 チューニングされたlda = チューニングモデル( lda_model )

ハイパーパラメータを調整すると、モデルの精度が向上します。 tune_model() 関数は、図 7 に示すように、線形判別分析モデルの精度を 0.9818 から 0.9909 に向上させます。

調整されたモデルの詳細

ステップ7

次のステップは、図 8 に示すように予測を行うことです。

調整されたモデルを使用した予測

 予測= predict_model ( tuned_lda )

predict_model() 関数は、テスト データ内に存在するサンプルの予測を行うために使用されます。

ステップ8

次に、図 9 に示すように、モデルのパフォーマンスをプロットします。

モデルのパフォーマンスの評価とプロット - 混同行列

 評価モデル( tuned_lda )

最小限の労力でさまざまなパフォーマンス メトリックを開発するには、evaluate_model() 関数を使用します。試してみて、出力を確認することができます。

<<:  模倣学習: ロボットはプログラミングなしで自然言語を理解できます!

>>:  エイリアンがトレンド検索リストのトップに!米国が初のUFO公聴会を開催

ブログ    
ブログ    

推薦する

最新のAIオープンソースプロジェクト12件をダウンロードする必要があります

[[242968]] #TensorFlow に基づく強化学習フレームワークDopamine は、強...

AI によって自動化された、誰でも使えるオンライン写真編集!北京大学の卒業生がアルゴリズムを新たな高みへ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

KDnuggets 公式調査: データ サイエンティストが最もよく使用する 10 のアルゴリズム

[[174162]]最新の KDnuggets 調査では、データ サイエンティストが最もよく使用する...

GoogleのチーフAIサイエンティスト、フェイフェイ・リーがスタンフォード大学のAIラボを離れ、再び戻る可能性

BI中国語ウェブサイトが6月28日に報じた。グーグルの主任人工知能(AI)科学者、フェイフェイ・リー...

人工知能がインターネットのパフォーマンスに与える影響

[[344519]]インテリジェント エッジ プラットフォームである Akamai のインスピレーシ...

脳とコンピューターのインターフェースのための新しい「接着剤」が発明され、人間と機械の融合「サイボーグ」における新たな進歩がもたらされる

マスク氏の脳コンピューターインターフェースは「人間でテスト」されようとしているが、侵襲的な脳コンピュ...

AI 開発者の高額給与は魅力的すぎるでしょうか?国内の開発者がAIに変革するためのガイドをぜひご利用ください

著者注: AI関連のニュースを閲覧すると、「高給」「年収100万ドル」など、非常に魅力的な言葉が頻繁...

2019 年の人工知能のトレンド トップ 25!一つの記事が未来を予見する

人工知能の次なる展開は?先週、有名な組織 CBinsights のアナリストがさまざまな業界を分析し...

「無人農業」は除草ロボットの導入も開始

農業は、国の経済発展における主要産業として、国民経済の重要な一環であり、常に国民経済の建設と発展を支...

...

...

省エネ1000倍!人間の脳のようなニューラルチップはAIモデルの実行時に大幅な電力節約が可能

現在最も成功している人工知能アルゴリズムである人工ニューラル ネットワークは、人間の脳内の実際のニュ...

...

...

...