きっと、コンピューターの画面を見て頭を悩ませ、「なぜコードでこの 3 つの用語を使用しているのだろう。これらの用語の違いは何だろう」と疑問に思ったことがあるでしょう。なぜなら、これら 3 つの用語はすべて非常によく似ているからです。 これらの用語の違いを理解するには、勾配降下法など、機械学習に関するいくつかの用語を知っておく必要があります。 勾配降下法の意味を簡単にまとめると次のようになります。 勾配降下法 これは、最適な結果 (曲線の最小値) を見つけるために機械学習で使用される反復最適化アルゴリズムです。 勾配とは、傾斜または斜面の傾きを意味します。 減少の意味はコスト関数の減少です。 このアルゴリズムは反復的であるため、最適な結果を得るには複数回使用する必要があります。勾配降下法の反復的な性質により、適合度の低いグラフを進化させて、データに最も適合したものを得ることができます。 勾配降下法には学習率と呼ばれるパラメータがあります。上の図の左に示すように、学習率は最初は大きいため、降下ステップのサイズは大きくなります。ポイントが減少するにつれて、学習率はますます小さくなり、したがって降下ステップ サイズも小さくなります。同時に、コスト関数も減少します。つまり、コストが減少します。これは損失関数または損失とも呼ばれますが、どちらも同じです。 (損失/コスト削減は良いことです) エポック、バッチ サイズ、反復などの用語を使用する必要があるのは、データが膨大な場合 (機械学習ではほとんどの場合に当てはまります) のみであり、その場合、データを一度にすべてコンピューターに取り込むことは不可能です。したがって、この問題を解決するには、データを小さなチャンクに分割し、それらを 1 つずつコンピューターに渡し、各ステップの最後にニューラル ネットワークの重みを更新して、指定されたデータに適合させる必要があります。 エポック 完全なデータセットがニューラル ネットワークを 1 回通過して戻ってくるプロセスをエポックと呼びます。 ただし、エポックがコンピューターで処理するには大きすぎる場合は、エポックを小さなチャンクに分割する必要があります。 複数のエポックを使用するのはなぜですか? 最初は奇妙に聞こえるかもしれませんが、完全なデータセットをニューラル ネットワークに 1 回渡すだけでは不十分で、同じニューラル ネットワークに完全なデータセットを複数回渡す必要があります。ただし、有限のデータセットを扱っており、学習プロセスとグラフを最適化するために反復プロセスである勾配降下法を使用していることを忘れないでください。したがって、重みを 1 回だけ更新したり、1 つのエポックを使用したりするだけでは不十分です。 エポック数が増加すると、ニューラル ネットワーク内の重みの更新回数も増加し、曲線はアンダーフィットからオーバーフィットへと変化します。 では、いくつのエポックが適切なのでしょうか? 残念ながら、この質問に対する正しい答えはありません。答えはデータ セットによって異なります。ただし、データの多様性は適切なエポック数に影響します。たとえば、黒猫だけのデータセットと、さまざまな色の猫のデータセットがあります。 バッチサイズ バッチ内のサンプルの合計数。注意: バッチ サイズとバッチ数は異なります。 BATCHとは何ですか? データをニューラル ネットワークに挿入できない場合は、データ セットを複数のバッチに分割する必要があります。 この記事を「はじめに」、「勾配降下法」、「エポック」、「バッチ サイズ」、「反復」などのいくつかの部分に分割して、記事を読みやすく理解しやすくします。 反復 反復を理解するために必要なのは、九九表か電卓だけです。反復は、バッチがエポックを完了するために必要な回数です。覚えておいてください: 1 つのエポックでは、バッチの数と反復回数は同じです。 たとえば、2000 個のトレーニング サンプルを含むデータ セットの場合。 2000 個のサンプルをサイズ 500 のバッチに分割すると、1 エポックを完了するには 4 回の反復が必要になります。 |
<<: cnBeta は、開発者が AI アプリケーションを構築するのに役立つ 3 つの新しい機械学習ツールをリリースしました。
家庭の安全に対する国民の意識が高まり、社会環境の動向が変化する現状において、家庭の安全は人々の日常的...
IDCは2019年9月の時点で、2023年までに人工知能技術への支出が3倍以上の979億ドルに達する...
[[440972]] 「秋名山には人が少なく、ドライバー同士が競争することが多い。今は自動運転車が...
[Lieyun.com (WeChat ID: )] 9月14日レポート(小白訳)ソフトウェアは世界...
免疫療法はがんの診断と治療に革命をもたらしていますが、まだ少数の患者(20%~30%)にしか効果があ...
ここ数年、人工知能技術が徐々に発展するにつれ、社会の中で人工知能に対するさまざまな見方が現れ始めまし...
6月28日、Xiaomiの人工知能およびクラウドプラットフォーム担当副社長である崔宝秋博士は、オープ...
発見とは何でしょうか? 数学には古くからある疑問があります。新しい数学的手法が発見された、あるいは発...
イーロン・マスク氏は、テスラが2020年末までに完全自動運転車を開発すると繰り返し強調している。 「...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
マスク氏が2021年末までに完全自動運転車を実現すると予言してから数ヶ月が経過したが、状況は2019...
AIの創造性の限界は何でしょうか?最近、ネットユーザーは、GPT-4 に適切なタイミングで PUA ...