PyCaret: 機械学習モデルの開発が簡単に

今日の急速に変化するデジタル世界では、組織はローコード/ノーコード (LC/NC) アプリケーションを使用して、新しい情報システムを迅速に構築します。この記事では、Python で書かれたローコード機械学習ライブラリである PyCaret を紹介します。

PyCaret は、R プログラミング言語の Caret (Classification And REgression Training の略) パッケージの Python バージョンであり、多くの利点があります。

作業効率を向上: PyCaret は、作業効率を向上できるローコードライブラリです。コーディングに費やす時間が短縮されるため、あなたとあなたのチームはビジネス上の問題に集中できるようになります。

使いやすい:この使いやすい機械学習ライブラリを使用すると、少ないコード行数でエンドツーエンドの機械学習実験を実行できます。

市販: PyCaret は市販のソリューションです。選択したノートブック環境内から迅速かつ効率的にプロトタイプを作成できます。

Python で仮想環境を作成し、次のコマンドを実行して PyCaret のフルバージョンをインストールできます。

 pip インストールpycaret [ フル]

機械学習の専門家は、分類、回帰、クラスタリング、異常検出、自然言語処理、関連ルールマイニング、時系列分析に PyCaret を使用できます。

PyCaret を使用した分類モデルの構築

この記事では、PyCaret のデータリポジトリから Iris データセットを取得し、PyCaret を使用して分類モデルを構築する方法について説明します。

作業を簡単にするために Google Colab 環境を使用し、以下の手順に従います。

ステップ1

まず、次のコマンドを実行して PyCaret をインストールします。

 pip インストールpycaret

ステップ2

次に、図 2 に示すようにデータセットを読み込みます。

データセットの読み込み

 pycaret.datasets からget_data をインポートする
データセット= get_data ( 'iris' )
 （または）
 pandasをpd としてインポートする
データセット= pd.read_csv ('/path_to_data/ file.csv ' )

ステップ3

次に、図 2 に示すように PyCaret 環境を設定します。

PyCaret 環境の設定

 pycaret からの分類インポート*
 clf1 = セットアップ( データ= データセット、 ターゲット= '種' )

PyCaret環境設定結果

PyCaret を使用してあらゆるタイプのモデルを構築する場合、環境設定が最も重要なステップです。デフォルトでは、setup() 関数は引数データ (Pandas データフレーム) とターゲット (データセット内のクラスラベル変数へのポインター) を受け入れます。 setup() 関数の結果を図 3 に示します。デフォルトでは、setup() 関数はデータの 70% をトレーニングセットに、30% をテストセットに分割し、図 3 に示すようにデータの前処理を実行します。

ステップ4

次に、図 4 に示すように、最適なモデルを見つけます。

最適なモデルを見つける

 ベスト= compare_models ()

デフォルトでは、compare_models() は 10 倍のクロス検証を適用し、図 4 に示すように、より短いトレーニング時間で、さまざまな分類器の精度、AUC、リコール、精度、F1 スコア、カッパ、MCC などのさまざまなパフォーマンスメトリックを計算します。 compare_models() 関数に tubro=True を渡すことで、すべての分類子を試すことができます。

ステップ5

次に、図 5 に示すようにモデルを作成します。

モデルの作成

 lda_model = create_model ( 'lda' )

図 4 に示すように、線形判別分析分類器は良好なパフォーマンスを示しました。したがって、lda を create_model() 関数に渡すことで、モデルを適合させることができます。

ステップ6

次のステップは、図 6 に示すように、モデルを微調整することです。

モデルの調整

 チューニングされたlda = チューニングモデル( lda_model )

ハイパーパラメータを調整すると、モデルの精度が向上します。 tune_model() 関数は、図 7 に示すように、線形判別分析モデルの精度を 0.9818 から 0.9909 に向上させます。

調整されたモデルの詳細

ステップ7

次のステップは、図 8 に示すように予測を行うことです。

調整されたモデルを使用した予測

 予測= predict_model ( tuned_lda )

predict_model() 関数は、テストデータ内に存在するサンプルの予測を行うために使用されます。

ステップ8

次に、図 9 に示すように、モデルのパフォーマンスをプロットします。

モデルのパフォーマンスの評価とプロット - 混同行列

 評価モデル( tuned_lda )

最小限の労力でさまざまなパフォーマンスメトリックを開発するには、evaluate_model() 関数を使用します。試してみて、出力を確認することができます。

<<: 模倣学習: ロボットはプログラミングなしで自然言語を理解できます!

>>: エイリアンがトレンド検索リストのトップに！米国が初のUFO公聴会を開催

PyCaret: 機械学習モデルの開発が簡単に

PyCaret を使用した分類モデルの構築

ステップ1

ステップ2

ステップ3

ステップ4

ステップ5

ステップ6

ステップ7

ステップ8

Facebook AI が、強力なフルスタックビデオライブラリである PyTorchVideo をオープンソース化し、モバイルフォンで SOTA モデルを 8 倍高速に実行できるようにしました。

Protobufを勉強していたら、良いアルゴリズムを見つけました - ZigZag

2020年グローバルスマート教育会議でAI教育統合イノベーションの成果が発表されました

LLM スループットは 2 ～ 4 倍に増加し、モデルが大きくなるほど効果も高まります。カリフォルニア大学バークレー校、スタンフォード大学などのオープンソースの効率的なメモリ管理メカニズム PagedAttention

2025年までに機械学習市場は967億ドルに達する

登ったり、ジャンプしたり、狭い隙間を通り抜けたり：オープンソースの強化学習戦略により、ロボット犬がパルクールを行えるようになる

データサイエンスがソーシャルメディアマーケティング戦略をどう変えるか

最先端技術の共有：脳の信号を音声に変換するAIアルゴリズムは、失語症の人が正常に話すことを助けることが期待されています

科学ニュース！光速でのディープラーニングを実現、GPUに別れを告げる

推薦する

都市は AI 導入をどのように進めているのでしょうか?

WOT2018 アルゴリズムモデルフォーラム: データが氾濫する中、アルゴリズムを使用してボトルネックを打破する方法

RLHF が LLM トレーニングの鍵となるのはなぜですか? AI専門家が5つの代替案を検討し、Llama 2のフィードバックメカニズムのアップグレードを説明

畳み込みニューラルネットワークの父：人工知能が動画から常識を学ぶための次のステップ

小さなデータ、大きな展望！米国のシンクタンクの最新レポート：長い間無視されてきた小規模データ人工知能の可能性は計り知れない

AI分野に新たな学者が加わりました！清華大学の胡世民が選出され、「Jitu」フレームワークは彼の研究室から生まれた

人間の姿勢評価技術の開発と実装

40の言語を同時に理解する人工知能が異言語コミュニケーションを支援

Baiduカスタマイズ画像オープンプラットフォームのトレーニングと評価

新世代のJVMガベージコレクションアルゴリズムがリリースされました

世界を理解する、最新のレビューは自動運転の新しい時代を開く

Sora がインターネット上で話題になるバイラル動画を作成、OpenAI は TikTok の競合製品を立ち上げようとしているのか?専門家は推測する：これは計画の一部である

AI（人工知能）はニッチな業界でお金を稼ぐ次のチャンスです