人工知能の博士による記事では、分類と回帰評価指標について詳しく説明しています。機械学習の必読書です。

人工知能の博士による記事では、分類と回帰評価指標について詳しく説明しています。機械学習の必読書です。

この記事では、機械学習における回帰と分類のさまざまな指標について説明します。私たちは常に、優れた機械学習アルゴリズムをモデル化するために必要な手順について考えています。最初のステップは、モデルのメトリックを評価することです。モデルを当てはめて予測を行うときは、常に誤差と精度を理解しようとします。この記事では、回帰と分類におけるさまざまな誤差測定方法を示し、説明します。

モデルの予測品質を評価するための基準はいくつかあります。

  • メトリック関数: この記事ではこれらについて学習します。
  • 推定スコアリング方式: この方法には、問題の解決策を評価するためのスコアリング方式があります。
  • スコアリングパラメータ: スコアリングパラメータは、モデル評価grid_search.GridSearchCVとcross_validation.cross_val_scoreで使用するメトリックを選択するように推定器に指示します。

基本的な定義

推定器:実際のデータ ポイントに基づいてより正確なモデリング ポイントを予測するために使用される関数または方程式です。
知っておくべきヒント
評価方法には、次の2つの注意点があります。

  • まず、いくつかのメソッドは score という単語で終わります。これは、値がここから取得され、グラウンド トゥルースを決定することを意味します。この場合、数字が大きいほど良いです。
  • 2番目は、単語がエラーまたは損失で終わる場合です。この場合、少ないほど良いです。

回帰指標
回帰パフォーマンスを評価するためのメトリックは次のとおりです。

  1. 説明された分散スコア: このメトリックは、データ ポイントの変動または分散を評価します。
  • この指標の計算式は次のとおりです。

Python の例:

  1. # sklearn から差分スコアをインポートする 
  2. sklearn.metricsからexpressed_variance_scoreをインポートします
  3. 真の値 = [ 5 , 2.5 , 3 , 6 ]
  4. 予測値 = [ 4.5 , 2.9 , 3 , 7 ]
  5. 説明された分散スコア(真の値、予測値)
  6. #出力:  
  7. 0.8525190839694656  

2. 最大誤差: このメトリックは、実際の値と予測値の間の最悪値を計算します。

  • 最大誤差の計算式は次のとおりです。

Pythonの例

  1. sklearn.metricsからmax_errorをインポート
  2. 真の値 = [ 5 , 2.5 , 3 , 6 ]
  3. 予測値 = [ 4.5 , 2.9 , 3 , 8 ]
  4. 最大誤差(真の値、予測値)
  5. #出力:  
  6. 2  

3. 平均絶対誤差: このメトリックは、真の値と予測値の差の平均誤差を計算します。このメトリックは、l1 ノルム損失に対応します。

  • この指標の計算式は次のとおりです。

Pythonの例

  1. sklearn.metricsからmean_absolute_errorをインポートします
  2. 真の値 = [ 5 , 2.5 , 3 , 6 ]
  3. 予測値 = [ 4.5 , 2.9 , 3 , 7 ]
  4. 平均絶対誤差(真の値、予測値)
  5. #出力:  
  6. 0.475  

3. 平均二乗誤差: このメトリックは、二乗誤差または損失を計算します。

  • 式は次のとおりです。

Pythonの例

  1. sklearn.metricsからmean_squared_errorをインポートする
  2. 真の値 = [ 5 , 2.5 , 3 , 6 ]
  3. 予測値 = [ 4.5 , 2.9 , 3 , 7 ]
  4. 平均二乗誤差(真の値、予測値)
  5. #出力:  
  6. 0.3525  

4. R 二乗スコア: このメトリックは、平均または近似回帰線などの推定値からデータの分布を計算します。多くの場合、「決定係数」と呼ばれます。

  • この指標の計算式は次のとおりです。

Pythonの例

  1. sklearn.metricsからr2_scoreをインポートする
  2. 真の値 = [ 5 , 2.5 , 3 , 6 ]
  3. 予測値 = [ 4.5 , 2.9 , 3 , 7 ]
  4. r2_score(真の値、予測値)
  5. #出力:  
  6. 0.8277862595419847  

分類指標

分類効果を評価するための指標は次のとおりです。

  1. 精度スコア: このメトリックは、予測値に等しい真の値の精度を計算し、スコアの割合を返します。正規化パラメーターがFALSEの場合は、真の予測値の合計数を返します。

式は次のとおりです。

Pythonの例

  1. sklearn.metricsからaccuracy_scoreをインポートする
  2. 真の値 = [ 5 , 2 , 3 , 6 ]
  3. 予測値 = [ 4 , 3 , 3 , 6 ]
  4. 精度スコア(真の値、予測値)

2. 分類レポート: このメトリックによって計算されたレポートには、分類問題の精度、再現率、F1 スコアが含まれます。

Pythonの例

  1. sklearn.metricsからclassification_reportをインポート
  2. 真の値 = [ 3 , 4 , 3 , 6 ]
  3. 予測値 = [ 4 , 3 , 3 , 6 ]
  4. target_names = [ 'アップル' 'オレンジ' 'キウイ' ]
  5. 印刷(分類レポート(真の値、予測値、ターゲット名=ターゲット名))

3. ヒンジ損失: この損失は、データ ポイントとモデルの予測ポイント間の平均距離を計算します。これは、最大マージンを取得するために SVM アルゴリズムでも使用されます。

  • 式は次のとおりです。

Pythonの例

  1. sklearnからsvmをインポート
  2. sklearn.metricsからhinge_lossをインポート
  3. sklearn.svmからLinearSVCをインポートします
  4. #x と y の値で設定されたデータ 
  5. x_values = [[ 3 ], [ 2 ]]
  6. y_値 = [- 1 , 1 ]
  7. #線形SVCモデルの使用 
  8. svm_linear = svm.LinearSVC(ランダム状態 = 0 )
  9. #モデルの適合 
  10. svm_linear.fit(x_values, y_values)
  11. リニアSVC(ランダム状態= 0 )
  12. #意思決定予測 
  13. 予測決定 = svm_linear.決定関数([[- 2 ], [ 3 ], [ 0.5 ]])
  14. ヒンジ損失([- 1 , 1 , 1 ], 予測決定)
  15. #出力:  
  16. 1.333372678152829  

結論は:

これらは、回帰と分類からモデルのパフォーマンスを評価するためのメトリックの一部です。分類には、回帰、バイナリ クラス、マルチクラス メトリックに基づくさまざまなメトリックがあります。

<<:  1秒以内に正確な推定を行う人工知能地震監視システムが稼働開始

>>:  人工知能は核爆弾と同じくらい人類にとって脅威なのでしょうか? AI脅威理論の謎を解く

ブログ    
ブログ    

推薦する

2024年に誰もが備えるべき5つのテクノロジートレンド

機械知能、現実と仮想の境界線の曖昧化、そしてインターネットの継続的な進化は、私たちの生活に根本的な影...

プログラマーのための上級書籍リスト: アルゴリズム

アルゴリズムの図解通常のアルゴリズムの本は、読む人を眠くさせ、理解不能で読みにくく、非常にイライラさ...

アリババDAMOアカデミーがAI分野の権威あるランキングトップ6を獲得:人間の学習方法で人間を超える

[[339371]] AIが人間の学習方法を模倣したら何が起こるでしょうか? 8月26日、アリババD...

私の国の最新のトップ10のブラックテクノロジーが発表され、あなたの想像力を覆します

人工知能の急速な発展により、「ブラックテクノロジー」という言葉が人々の心に深く根付いている。目もくら...

卒業後すぐに年収56万は貰えるんですか?右! Twitterの機械学習の専門家が書いた上級マニュアルをご覧ください

[[210651]]年収10万?プログラマーにとっては、これで十分です。国家統計局が今年上半期に発表...

Vision Pro が 50 億ドルで売却され、ザッカーバーグは大喜び! Metaは500億ドルを燃やし、VR復活の希望がここにある

海外メディアの報道によると、2月2日の正式発売前に、AppleのVision Proはすでに20万台...

AI技術年次報告:中国の2つの側面におけるパフォーマンスは注目に値する

スタンフォード大学は最近、「人工知能指数(2018年グローバルAIレポート)」を発表しました。これは...

ロシアのロボット宇宙飛行士が3Dプリントされた骨組織サンプルを持って地球に帰還

ロシア衛星ネットワークによると、最近、ロシアの「3Dバイオプリンティングソリューションズ」社のマネー...

ディープラーニングは、データが不足している場合、無力なのでしょうか?ここにいくつかの良いアイデアがあります!

ディープラーニングは、データが大量にある場合、どんなに複雑な問題でも問題ありません。しかし、データが...

フェデレーテッドラーニング - プライバシーの障壁を突破し、データの価値を引き出す

1. フェデレーテッドラーニングの背景従来の機械学習手法では、トレーニングのためにデータを単一のマシ...

機械学習のための数学をどのように学ぶのでしょうか?

機械学習では数学が非常に重要です。アルゴリズムにおけるモデルコードの理解と、エンジニアリングにおける...

マスク:オプティマスプライムと歩く

テスラのロボットが服を畳むという現象が、今、大流行している。数日後、マスク氏はオプティマスプライムが...

2021 年のロボティック プロセス オートメーション (RPA) 面接の 6 つの質問

[[379840]] [51CTO.com クイック翻訳] 求職者や採用担当者は、RPA 面接にどう...

6つのトラックと10のテクノロジー: インテリジェントボディと3D生成がAIを活性化し、空間コンピューティングがターミナル変革を切り開く

2000年前に生きていた古代人が1000年前に戻ったとしても、適応できるものは多くないかもしれません...

AI導入において、テクノロジーは最大の課題ではないが、人材は

[[427056]]写真: ゲッティ従来型企業の経営幹部が人工知能 (AI) や機械学習 (ML) ...