この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 ある日、パラメータ調整者がディープラーニング モデルをトレーニングしていました。使用された 2 つのデータ セットには、異なる損失関数がありました。データ セットのサイズは固定されておらず、毎日増加していました。 彼は少し心配していました。エポック番号をどうやって設定すればいいのでしょうか? 苦労しているうちに、彼は突然思いつきました。なぜエポック番号を設定する必要があるのだろう?必要なのは、各バッチに対して独立した同一分布サンプリング(IID サンプリング) を実行することだけです。 この考えを検証するために、貂蝉は多くの論文を読みました。トレーニング方法を紹介する際に、反復回数のみに言及し、エポックについては言及しない人が増えていることに気づきました。 彼は、エポック社がデータセットが限られていることを暗示し強調しており、それが厄介なだけでなく潜在的に「有害」であると考えました。 Epoch を削除してループのネスト レベルの数を減らすことは常に良いことです。 そこで彼は Reddit で議論を始めました。「Epoch は時代遅れか、あるいは有害か?」 Epochは冗長ですか?この見解に同意する人もいます。
しかし、パラメータ調整者は、各サンプルが定期的に使用されているかどうかが疑問点であると感じています。IID サンプリングによって同じ分布が保証されており、同じ頻度で使用することは誤解を招きます。 反対派はこう信じている。
最終的に、Tiaocanxia は、この論争は統計学における「頻度学派VSベイズ学派」、つまりデータセットが確実であるべきか不確実であるべきかという論争に少し似ていると結論付けました。 モデルを比較するにはどうすればいいですか?Diaocanxia は、損失曲線を作成するためにバッチ損失を使用する人もいることにも気づきました。彼は、これが Epoch Loss よりも参考資料として価値があると考えています。 対戦相手はあなたのアプローチが良いと考えていますが、Epoch はまだ有用です。 同じハードウェアであっても、異なるモデルの異なるアルゴリズムの効率によって大きな違いが生じる可能性があるからです。
最後に、あるネットユーザーが CV モデルを例にこのトピックの素晴らしい要約を作成し、損失を視覚化する 4 つの方法をリストし、どの方法をどのような状況で使用するかを紹介しています。 損失/エポックは、モデルが同じ画像を理解するために何回観察する必要があるかを示します。 損失/反復は、必要なパラメータ更新の回数を示します。これはオプティマイザーを比較するときに役立ち、より速くトレーニングしたり、より高い精度を達成したりするのに役立ちます。 損失/合計画像表示は、アルゴリズムが画像のどの程度を見たかによる損失を示します。データを使用する際の 2 つのアルゴリズムの効率を比較するのに適しています。 アルゴリズムが 500,000 枚の画像で 70%、100 万枚の画像で 75% を取得する場合、それはおそらく 500,000 枚の画像で 50%、100 万枚の画像で 80% を取得する場合よりも優れています。 さらに、バッチ サイズの影響も排除されます。これにより、異なる GPU でトレーニングされた異なるバッチ サイズのモデル間の公平な比較が可能になります。 損失/時間も重要です。新しいモデルによってエポックが 100 削減されても、各反復が 100 倍遅くなる場合、このモデルは選択されません。 Loss/Time はハードウェアの特定のパフォーマンスに関連し、十分に正確ではありませんが、これについては論文には書きません。しかし、自分のマシン上でモデルのパラメータを評価するには良い方法です。 データ拡張を使用する場合はどうでしょうか?一部のネットユーザーは、データ拡張中に Epoch が少し冗長であると指摘しています。データ セットが小さすぎるため、わずかな違いがある各サンプルのバージョンを人為的に多数追加します。それらを同じ頻度で使用する必要はありません。 反対派は、正規化の一形態としてのデータ拡張によって過剰適合が軽減されると主張しますが、実際に導入される情報は、モデルをトレーニングするときに元のデータセットに限定されます。元のデータセットが十分に小さい場合、Epoch はトレーニング セット全体をモデルに表示することを意味しますが、それでも意味があります。 誰かが尋ねました:
パラメータ調整機能:
△ERA(Endless Random Enhancement)の頭文字は「時代」を意味します |
<<: 自動運転の安全上のリスクはどこから来るのでしょうか?
>>: AIの冬がまた来るのか?アメリカ人教授がarXivにAIを批判する記事を掲載し、Redditのネットユーザーから批判された
IBMは最近、新たな企業投資ツールであるEnterprise AI Venture Fundを立ち上...
今日の人工知能、ビッグデータ、自動化の時代では、技術的なスキルとデータリテラシーが非常に重要です。し...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[434825]]人工知能が教育に浸透する中で、我々は「静をもって動を制御する」という決意を持ち、...
過去 20 年間で、世界はテクノロジーにおいて驚異的な進歩を遂げ、人間の生活のさまざまな側面に影響を...
1. 新しいユーザーシナリオでの実験が直面する問題1. UGパノラマUGのパノラマビューです。 U...
人工知能は、時間の経過とともに改良を続け、世界中の人々から賞賛されてきた、人間の設計の驚異です。 T...
先週、「Facezam」と呼ばれる偽のアプリがFacebookの写真をスキャンして人々の顔を追跡でき...
現在、人類社会が直面している人工知能のセキュリティ問題は、人工知能のアルゴリズムとシステムの特性によ...
3Dバイオプリンティング技術は、3Dプリンターを使用して細胞や生物学的材料を含む「インク」を特定の形...
AR、VR、3Dプリント、シーン構築、映画制作など多くの分野において、衣服を着た人体の高品質な3Dモ...
データベースの保存方法によって、データベース操作の効率が決まります。51CTO データベース チャネ...
過去15年間、欧州で犯罪者を追う警察は、指紋、DNAデータ、自動車所有者の詳細を相互に共有することが...