AI 初心者必読 | パラメーターとハイパーパラメーターの違いがまだよくわかりませんか?

AI 初心者必読 | パラメーターとハイパーパラメーターの違いがまだよくわかりませんか?

[[244078]]

コンピュータサイエンスには多くの用語があり、それらの多くは一貫して使用されていません。同じ用語であっても、異なる分野の人々はそれを異なる方法で理解します。

たとえば、 「モデル パラメーター」と「モデル ハイパーパラメーター」です。

初心者にとって、明確な定義のないこれらの用語は確かに混乱を招く可能性があります。特に統計学や経済学の分野から来た人にとっては。

これらの用語を詳しく見てみましょう。

モデルパラメータとは何ですか?

モデル パラメーターは、データから値を推定できるモデル内の構成変数です。

  • モデルは予測を行うためにそれらを必要とします。
  • それらの値によって、使用できるモデルが定義されます。
  • それらはデータから推定または学習されます。
  • 通常、プログラマーが手動で設定することはありません。
  • これらは通常、学習モデルの一部として保存されます。

パラメータは機械学習アルゴリズムの鍵となります。これらは通常、過去のトレーニング データから要約されます。

従来の機械学習の文献では、モデルは仮説であり、パラメーターは特定のデータセットに合わせた仮定であると考えることができます。

最適化アルゴリズムは、モデルパラメータを推定するための効果的なツールです。

  • 統計: 統計では、ガウス分布などの変数の分布を想定できます。ガウス分布の 2 つのパラメータは、平均 (μ) と標準偏差 (シグマ) です。これは機械学習に適しており、これらのパラメータをデータから推定し、予測モデルの一部として使用することができます。
  • プログラミング: プログラミングでは、関数にパラメータを渡すことができます。この場合、引数は関数パラメータであり、値の範囲の 1 つを持つことができます。機械学習では、使用する特定のモデルは、新しいデータに対して予測を行うためにパラメータを必要とする関数です。

モデルのパラメータの数が固定か可変かによって、そのモデルが「パラメトリック」か「非パラメトリック」かが決まります。

モデル パラメータの例には次のものがあります。

  • ニューラル ネットワーク内の重み。
  • サポート ベクター マシン内のサポート ベクター。
  • 線形回帰またはロジスティック回帰における係数。

モデルのハイパーパラメータとは何ですか?

モデルのハイパーパラメータは、データから値を推定できないモデルの外部の構成です。

  • これらは、モデル パラメータの推定によく使用されます。
  • 通常は手動で割り当てられます。
  • 通常はヒューリスティック設定を使用できます。
  • これらは多くの場合、特定の予測モデリングの問題に合わせて調整されます。

特定の問題に対するモデルのハイパーパラメータの最適値を知ることはできませんが、経験則を使用したり、他の問題で値を複製したり、試行錯誤を通じて最適値を探したりすることはできます。

機械学習アルゴリズムを特定の問題に合わせて調整すると (たとえば、グリッド検索やランダム検索を使用する場合)、モデルのハイパーパラメータまたはシーケンスが調整され、最も優れたモデル予測につながるパラメータが検出されます。

  • 「多くのモデルには、データから直接推定できない重要なパラメータがあります。たとえば、K 近傍分類モデルでは、適切な値を計算するために使用できる解析式がないため、このようなタイプのモデル パラメータはチューニング パラメータと呼ばれます。」

- 64-65 ページ、応用予測モデリング、2013 年

モデルハイパーパラメータがモデルパラメータと呼ばれた場合、多くの混乱が生じることになります。この混乱を克服するための経験則は次のとおりです。

モデル パラメータを手動で指定する必要がある場合、それはおそらくモデル ハイパーパラメータです。

モデルのハイパーパラメータの例には次のものがあります。

  • ニューラル ネットワークをトレーニングするための学習率。
  • サポート ベクター マシンの C および sigma ハイパーパラメータ。
  • K 個の最も近い近傍。

要約すると、モデルパラメータはデータから自動的に推定されます。ただし、モデルのハイパーパラメータは手動で設定され、プロセス内でモデルパラメータの推定に使用されます。

モデルのハイパーパラメータは、手動で設定および調整する必要がある機械学習の一部であるため、パラメータと呼ばれることがよくあります。

<<:  機械学習は将来どこに向かうのでしょうか?インテル・南京大学共同研究センターが答えを提供する

>>:  詩人のような機械学習: ML の仕組みについての素晴らしい啓示

ブログ    
ブログ    

推薦する

ジェネレーティブ AI 時代のデータ センターの再構築

最近の人工知能に関する議論には、OpenAI の大規模言語モデル (LLM) の GPT ファミリー...

NIOはまたしても窮地に陥った!運転支援の責任は誰が負うべきでしょうか?

[[417840]]運転支援機能がまた事故を起こした。昨日、「Meiyihao」という公開アカウン...

DeepMindらが優秀論文賞を受賞、IBMスーパーコンピュータDeep Blueが古典に、IJCAI2023の賞が発表

国際人工知能合同会議(IJCAI)は、AI分野におけるトップクラスの学術会議の一つです。第1回会議は...

AIが書いたコンテンツは判別が難しく、言語の専門家でさえ無力である

9月10日のニュース、2023年は人工知能の年です。チャットボットChatGPTから、グラミー賞に参...

生成AI技術を使用した企業リスク管理

近年、急速に進化する生成型AI技術が広く注目を集めており、多方面に大きな影響を与えると期待されていま...

...

超音波チップが脳コンピューターインターフェースに革命をもたらす:非侵襲的インプラントに一歩近づく

2023年、脳コンピューターインターフェース(BCI)技術は依然として急速な発展の年を迎えました。脳...

快手ドラゴンフライ戦略エンジンの設計と応用

1. 問題と課題1. 問題の背景2018年以来、Kuaishouの事業全体は急速に発展しており、チー...

2021年の世界人工知能産業の市場規模と投資・資金調達状況を分析人工知能は今後スパイラル状に発展する

人工知能業界の主要上場企業:現在、国内の人工知能業界の上場企業は主に百度(BAIDU)、テンセント(...

スタンフォード大学の中国人博士、フェイフェイ・リー氏は、スライドモデルを提案し、NVIDIAと共同で汎用人工知能を研究した。

[[409525]]機械学習は、インテリジェントエージェントの学習効率と一般化能力を大幅に向上させ...

人工知能:現在も将来も有望

最近、2020年世界人工知能会議が中国上海で開催されました。各国の専門家らがオンラインで議論し、人工...

自動化の将来はどうなるのでしょうか?

自動化ほど製造業界に大きな影響を与え、破壊的な影響を与えたテクノロジーはほとんどありません。自動化の...

スタンフォード大学は対照的嗜好学習を提案:強化学習なしで人間のフィードバックから学習する

人間によるフィードバックによる強化学習 (RLHF) は、モデルを人間の意図に合わせるための一般的な...

Jetson - Nano Opencv の基本的な使用方法

序文:前回のJetson Nanoの記事では、学習のためのアイデアや教材を紹介しました。今日は、引き...

...