人工知能の博士による記事では、分類と回帰評価指標について詳しく説明しています。機械学習の必読書です。

この記事では、機械学習における回帰と分類のさまざまな指標について説明します。私たちは常に、優れた機械学習アルゴリズムをモデル化するために必要な手順について考えています。最初のステップは、モデルのメトリックを評価することです。モデルを当てはめて予測を行うときは、常に誤差と精度を理解しようとします。この記事では、回帰と分類におけるさまざまな誤差測定方法を示し、説明します。

モデルの予測品質を評価するための基準はいくつかあります。

メトリック関数: この記事ではこれらについて学習します。
推定スコアリング方式: この方法には、問題の解決策を評価するためのスコアリング方式があります。
スコアリングパラメータ: スコアリングパラメータは、モデル評価grid_search.GridSearchCVとcross_validation.cross_val_scoreで使用するメトリックを選択するように推定器に指示します。

基本的な定義

推定器:実際のデータポイントに基づいてより正確なモデリングポイントを予測するために使用される関数または方程式です。
知っておくべきヒント
評価方法には、次の2つの注意点があります。

まず、いくつかのメソッドは score という単語で終わります。これは、値がここから取得され、グラウンドトゥルースを決定することを意味します。この場合、数字が大きいほど良いです。
2番目は、単語がエラーまたは損失で終わる場合です。この場合、少ないほど良いです。

回帰指標
回帰パフォーマンスを評価するためのメトリックは次のとおりです。

説明された分散スコア: このメトリックは、データポイントの変動または分散を評価します。

この指標の計算式は次のとおりです。

Python の例:

 # sklearn から差分スコアをインポートする 
 sklearn.metricsからexpressed_variance_scoreをインポートします
真の値 = [ 5 , 2.5 , 3 , 6 ]
予測値 = [ 4.5 , 2.9 , 3 , 7 ]
説明された分散スコア(真の値、予測値)
 ＃出力：  
 0.8525190839694656

2. 最大誤差: このメトリックは、実際の値と予測値の間の最悪値を計算します。

最大誤差の計算式は次のとおりです。

Pythonの例

sklearn.metricsからmax_errorをインポート
真の値 = [ 5 , 2.5 , 3 , 6 ]
予測値 = [ 4.5 , 2.9 , 3 , 8 ]
最大誤差(真の値、予測値)
 ＃出力：  
 2

3. 平均絶対誤差: このメトリックは、真の値と予測値の差の平均誤差を計算します。このメトリックは、l1 ノルム損失に対応します。

この指標の計算式は次のとおりです。

Pythonの例

sklearn.metricsからmean_absolute_errorをインポートします
真の値 = [ 5 , 2.5 , 3 , 6 ]
予測値 = [ 4.5 , 2.9 , 3 , 7 ]
平均絶対誤差(真の値、予測値)
 ＃出力：  
 0.475

3. 平均二乗誤差: このメトリックは、二乗誤差または損失を計算します。

式は次のとおりです。

Pythonの例

sklearn.metricsからmean_squared_errorをインポートする
真の値 = [ 5 , 2.5 , 3 , 6 ]
予測値 = [ 4.5 , 2.9 , 3 , 7 ]
平均二乗誤差(真の値、予測値)
 ＃出力：  
 0.3525

4. R 二乗スコア: このメトリックは、平均または近似回帰線などの推定値からデータの分布を計算します。多くの場合、「決定係数」と呼ばれます。

この指標の計算式は次のとおりです。

Pythonの例

sklearn.metricsからr2_scoreをインポートする
真の値 = [ 5 , 2.5 , 3 , 6 ]
予測値 = [ 4.5 , 2.9 , 3 , 7 ]
 r2_score(真の値、予測値)
 ＃出力：  
 0.8277862595419847

分類指標

分類効果を評価するための指標は次のとおりです。

精度スコア: このメトリックは、予測値に等しい真の値の精度を計算し、スコアの割合を返します。正規化パラメーターがFALSEの場合は、真の予測値の合計数を返します。

式は次のとおりです。

Pythonの例

sklearn.metricsからaccuracy_scoreをインポートする
真の値 = [ 5 , 2 , 3 , 6 ]
予測値 = [ 4 , 3 , 3 , 6 ]
精度スコア(真の値、予測値)

2. 分類レポート: このメトリックによって計算されたレポートには、分類問題の精度、再現率、F1 スコアが含まれます。

Pythonの例

sklearn.metricsからclassification_reportをインポート
真の値 = [ 3 , 4 , 3 , 6 ]
予測値 = [ 4 , 3 , 3 , 6 ]
 target_names = [ 'アップル' 、 'オレンジ' 、 'キウイ' ]
印刷(分類レポート(真の値、予測値、ターゲット名=ターゲット名))

3. ヒンジ損失: この損失は、データポイントとモデルの予測ポイント間の平均距離を計算します。これは、最大マージンを取得するために SVM アルゴリズムでも使用されます。

式は次のとおりです。

Pythonの例

sklearnからsvmをインポート
sklearn.metricsからhinge_lossをインポート
sklearn.svmからLinearSVCをインポートします
#x と y の値で設定されたデータ 
 x_values = [[ 3 ], [ 2 ]]
 y_値 = [- 1 , 1 ]
 #線形SVCモデルの使用 
 svm_linear = svm.LinearSVC(ランダム状態 = 0 )
 #モデルの適合 
 svm_linear.fit(x_values, y_values)
リニアSVC(ランダム状態= 0 )
 #意思決定予測 
予測決定 = svm_linear.決定関数([[- 2 ], [ 3 ], [ 0.5 ]])
ヒンジ損失([- 1 , 1 , 1 ], 予測決定)
 ＃出力：  
 1.333372678152829

結論は：

これらは、回帰と分類からモデルのパフォーマンスを評価するためのメトリックの一部です。分類には、回帰、バイナリクラス、マルチクラスメトリックに基づくさまざまなメトリックがあります。

<<: 1秒以内に正確な推定を行う人工知能地震監視システムが稼働開始

>>: 人工知能は核爆弾と同じくらい人類にとって脅威なのでしょうか? AI脅威理論の謎を解く

人工知能の博士による記事では、分類と回帰評価指標について詳しく説明しています。機械学習の必読書です。

ネイチャー誌の表紙：AIの翼に乗って、データが計算社会科学を「担う」

ChatGPT が個人情報を含むトレーニングデータを吐き出す: DeepMind が論争を巻き起こす大きなバグを発見

Pangu-Agentの5つのイノベーション

ビッグニュース！人工知能における新たなブレークスルー！ Google ストリートビューを使って住民の投票傾向を調べてみましょう。

上海の疫病対策において人工知能は何を果たしたのか？

会員数3億人、商品数4億点、大規模電子商取引の商品推奨にディープラーニングを応用！

2021年世界人工知能会議が開幕。董明珠、馬化騰、李延紅、周紅一などの大物たちは何を語ったのか？

SAM によるゼロショットビデオオブジェクトセグメンテーション! HKUSTと他の研究チームは、教師ありSOTAに匹敵するパフォーマンスを持つ初の「スパースポイント伝播」手法SAM-PTをオープンソース化しました。

推薦する

アリババは、DAMOアカデミーの1990年代生まれの科学者が開発した新世代のAIアルゴリズムモデルをオープンソース化しました。

顔認証の時代が本当に到来しました。あなたも参加してみませんか？

絵画制作において想像力を最大限に発揮できる 8 つの優れた AI ペイントツール

専門家の視点：量子コンピューティングの開発動向

人工知能は人間のキャリアにどのような影響を与えるのでしょうか? 11のトレンド予測はこちら

クラウドアーキテクチャに生成 AI を追加するためのヒント

合成データは AI をより良くすることができるでしょうか?

ステッカーでAIから見えなくなったら、AIにとんでもないバグが発生した

2時間で人間を超えることができます！ DeepMind の最新 AI が 26 の Atari ゲームをスピードラン

なぜ「ハイエンド」アルゴリズムエンジニアはデータ移民労働者になったのでしょうか?

RPA大手UiPath独占インタビュー：やがて「1人1台ロボット」の時代が到来

Amazon が「AI チケット」を購入するために 40 億ドルを費やす!ユニコーン企業に投資し、ライバル企業から幹部を引き抜く

機械学習における皇帝の新しい服の発見

海外のAIは使えない？国内お宝AIツール6選をシェア！