機械学習におけるパラメトリック手法とノンパラメトリック手法

機械学習におけるパラメトリック手法とノンパラメトリック手法

導入

前回の記事では、統計学習における予測と推論の違いを紹介しました。これら 2 つの方法の主な違いは最終目標にありますが、どちらも未知の関数 f を推定する必要があります。

[[427125]]

つまり、下の図に示すように、入力 (つまり、独立変数 X のセット) を出力 (つまり、ターゲット変数 Y) にマッピングする関数を学習する必要があります。

Y = f(X) + ε

未知の関数を推定するには、データにモデルを適合させる必要があります。推定しようとしている関数の形式は通常は不明であるため、それを取得するには異なるモデルを適用したり、関数 f の形式について何らかの仮定を立てたりする必要がある場合があります。一般に、このプロセスはパラメトリックまたは非パラメトリックになります。

本日の記事では、機械学習におけるパラメトリック手法とノンパラメトリック手法について説明します。さらに、主な違いと主な利点と欠点についても検討します。

パラメータ化されたメソッド

パラメトリック法では、通常、関数 f の形式について仮定を立てます。たとえば、未知の関数 f が線形であると仮定できます。つまり、関数は次のようになると仮定します。

f(X) = β₀ + β₁ X₁ + … + βₚ Xₚ

ここで、f(X) は推定する未知の関数、β は学習する係数、p は独立変数の数、X は対応する入力です。

推定する関数の形式について仮定を立て、この仮定に適合するモデルを選択したので、最終的にモデルをトレーニングして係数を推定するのに役立つ学習プロセスが必要になります。

機械学習におけるパラメトリック手法では通常、モデルベースのアプローチが採用されます。このアプローチでは、推定する関数の形式について仮定を立て、その仮定に基づいて適切なモデルを選択してパラメータ セットを推定します。

パラメトリック手法の最大の欠点は、私たちが行う仮定が必ずしも正しいとは限らないことです。たとえば、関数の形式が線形であると想定しても、実際にはそうではありません。したがって、これらの方法は柔軟性の低いアルゴリズムを伴い、通常は複雑でない問題を解決するために使用されます。

パラメトリック法は非常に高速で、必要なデータもはるかに少なくなります (これについては次のセクションで詳しく説明します)。さらに、パラメトリック手法は柔軟性は低いものの、私たちが立てた仮定に基づいているため、解釈が容易です。

機械学習におけるパラメトリック手法には、線形判別分析、単純ベイズ、パーセプトロンなどがあります。

ノンパラメトリック法

一般に、ノンパラメトリック法とは、推定する関数の形式について根本的な仮定を行わないアルゴリズムのセットを指します。この方法では、仮定がないので、未知の関数 f のあらゆる形式を推定できます。

ノンパラメトリック法は、データ ポイントへの最適な適合を求めるため、より正確になる傾向があります。しかし、これは多数の観測値(未知の関数 f を正確に推定するために必要なもの)を犠牲にして行われます。そして、これらの方法はモデルのトレーニングには非効率的であることが多いです。もう 1 つの問題は、ノンパラメトリック手法では、アルゴリズムがより柔軟であるため、新しい未知のデータ ポイントにうまく一般化されない方法でエラーやノイズを学習することがあり、過剰適合が発生する可能性があることです。

ノンパラメトリック手法は非常に柔軟性が高く、基礎となる関数について何の仮定も立てないため、モデルのパフォーマンスを向上させることができます。

機械学習におけるノンパラメトリック手法の例としては、サポートベクターマシンや kNN などがあります。

要約する

今日の記事では、機械学習におけるパラメトリック手法とノンパラメトリック手法について、またそれぞれの長所と短所について説明しました。

パラメトリック法は柔軟性と精度に劣る傾向がありますが、解釈可能性は高くなります。一方、ノンパラメトリック法は柔軟性が高く (したがって、より複雑な問題に適している)、精度に優れていますが、解釈可能性は低くなります。

パラメトリック法は柔軟性が低く、精度も劣る場合がありますが、非常に柔軟なノンパラメトリック法を単純な問題に使用すると過剰適合につながる可能性がある多くのユースケースでは、依然として有用です。

<<:  ドローンの将来の用途

>>:  ついにアルゴリズムが「修正」されました!

ブログ    

推薦する

北京、自動運転路上試験の新規則を発表、有人試験も可能に

最近、北京市交通委員会は新たに改訂された「北京市自動運転車両路上試験管理実施規則(試行)」を発行し、...

GPT-4+Midjourney がコードなしで「Angry Pumpkin」を作成!実際の経験:閾値は低くなく、再現が難しい

市販の AI ツールを使えば、自分でコードを 1 行も書かずに完全な「Angry Birds」を作れ...

スループットが約30倍に増加しました。田元東チームの最新論文は、大規模モデル展開の問題を解決している

大規模言語モデル (LLM) は今年非常に人気がありました。しかし、その驚異的な効果の背後には、巨大...

...

次世代のインターネット技術 - ディープラーニング

[[384617]]過去 20 年間がインターネットの急速な発展の 20 年間であったとすれば、次の...

ロボットが「自己認識」を持つためには、まず自分の声を認識する必要があるのでしょうか?

人工知能の発展の波の中で、人間はロボットが自己認識を持つことに対して非常に警戒心を抱いています。結局...

上海交通大学卒業生によるソロ作品! 50年間のゼロ進歩アルゴリズム問題が解決された

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

10x Nvidia GPU: Google TPUスタートアップチームによる、モデル固有の大型チップが一夜にして有名に

モデルが GPT-3.5 のように数千億の規模に達すると、トレーニングと推論のための計算能力は一般的...

スマートシティの建設が加速、ドローンが4つの面で貢献

[[415675]]都市化が継続的に加速し、都市人口が継続的に増加したことで、人々は質の高い都市生活...

デジタルマーケティングにおけるAI革命

ほんの数年前までは、マーケティングに特化した AI エンジンがマーケティングの未来につながると信じて...

...

騒ぎの裏で、2020年はケータリングロボットにとって楽な年になるだろうか?

最近、ロボットに特化したレストランが広州に正式にオープンしました。客の出迎えから調理まで、一連の作業...

人工知能技術はビッグデータに基づいていますか?

[[201662]]今や、AI やロボットが徐々に人間の仕事に取って代わる時代になりました。知らな...

行動分析:誤解された人工知能がもたらすセキュリティリスク

誇大宣伝を信じるなら、人工知能 (AI) と機械学習 (ML) はすでに現代の IT インフラストラ...

音声認識システムが裁判にかけられる

舒城県裁判所杭埠法廷は最近、建設工事契約紛争事件の審理に法廷音声認識システムを使用した。これは、杭埠...