アダムとイブ: ディープラーニングの問題を解決するための強力なツール

アダムとイブ: ディープラーニングの問題を解決するための強力なツール

[[242433]]

[51CTO.com クイック翻訳] 近年、ディープラーニングの波がインターネットの隅々まで広がりました。フィンテックから電子商取引、不正防止から推奨システムまで、ディープラーニングはあらゆるところで見られます。ディープラーニングの本質はニューラルネットワークです。ニューラルネットワークの深さにより、いかにして計算を迅速かつ効率的に実行するかがディープラーニングにおいて非常に重要なテーマとなっています。ニューラル ネットワークのトレーニングにおける確率的勾配降下法の問題に対応して、学者たちはアダム法とイブ法を提案しました。これらはディープラーニングの問題を解決するための強力なツールとなっています。

まず、アダムメソッドとは何かを見てみましょう。

Hiroaki Hiyashi、Jayanth Koushik、Graham Neubig は、論文「Eve: 局所的および全体的に適応可能な学習率を備えた勾配ベースの最適化手法」で Adam アルゴリズムを改良する方法を提案し、Eve 法と名付けました。 Eve の方法は Adam のアルゴリズムを改良したものです。まずはアルゴリズムの疑似コードを見てみましょう。

***、データの安定性と滑らかさの問題に対処するために、学習率を処理し、アルゴリズムの疑似コードに示されている手順を取得します。

CNN モデルと RNN モデルにおける Adam アルゴリズムと Eve アルゴリズムの評価結果を次の図に示します。

Eve アルゴリズムは、他のアルゴリズムよりも CNN で優れた結果を達成し、RNN でも優れたパフォーマンスを発揮することがわかります。

機械学習とデータマイニングは長年にわたって人気がありますが、実際には統計的確率と最適化の基礎と切り離すことはできません。通常、機械学習やデータマイニングの専門家のほとんどは業界に深く関わっているため、数学の高度な習熟度に対する要件はそれほど高くありません。特に中国企業の場合、国際的なトレンドに追従するだけで十分です。

しかし、技術的な理解やさらなる学習のためには、落ち着いて数学を注意深く勉強することが非常に役立つこともあります。 Adam アルゴリズムと Eve アルゴリズムの数学的原理自体は複雑ではありません。使用される唯一の統計概念は、偏りのない統計です。実践者にとって、そのシンプルでエレガントなアイデアを真剣に研究する価値はあります。

[[242435]]

恒昌立通のビッグデータ部門責任者兼シニアアーキテクトの王昊氏は、ユタ大学で学士号/修士号を取得し、国際経済貿易大学で実務MBAを取得しています。 Baidu、Sina、NetEase、Doubanなどの企業で長年にわたり研究開発と技術管理に携わっており、機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析などの技術に長けています。 TVCGやASONAMなどの国際会議やジャーナルに8本の論文を発表している。私の学部論文は 2008 IEEE SMI *** 論文賞を受賞しました。

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  今後 10 年間で 21 の新しい仕事が生まれます。あなたに何ができるか見てみましょう。

>>:  AIを使って内部脅威を特定することの倫理

ブログ    
ブログ    

推薦する

...

6000 以上の Web ページを閲覧した後、個人使用に最適な AI 製品のリストを選択しました。

[[220539]]リアム・ヘーネル編集者: Chaoxi、Yuanyuan、Harryこの記事で...

...

OpenAI、開発者向けGPTチャットボットAPIのメジャーアップデートを発表、価格を値下げ

OpenAI は本日、大規模言語モデル API (GPT-4 および gpt-3.5-turbo を...

マイクロソフトがAIインフラサービスコード名「Singularity」を発表

Microsoft Azure と研究チームは協力して、コードネーム「Singularity」という...

人工知能の6つの主要概念とAIプロジェクトを実装するための7つの考慮事項を1つの記事で理解する

AI はすべての問題を解決できるわけではありませんが、正しく適用すれば短期間で大きな変化をもたらすこ...

...

仕事の未来に向けたスマートデバイスの準備

パンデミック以前は、スマートデバイスは接続できなかった可能性があります。しかし、従業員が自宅からログ...

顔認識の国家基準に関する意見募集:顔のスキャンや嗜好予測の義務化はなし

近年、顔認証が話題になっていますが、現実には、通知なく顔認証データを取得したり、強制的に顔認証させら...

ナレッジグラフは複雑ではありません。整理するお手伝いをさせてください。

[51CTO.com からのオリジナル記事] インターネットビジネスの発展に伴い、大量のデータが生...

Huawei Cloud Tianchou AI Solverが世界人工知能会議で最高賞を受賞

7月6日、 2023年世界人工知能会議(WAIC 2023)が上海で開幕し、同会議の最高賞である「優...

おとぎ話を使ってAIモデルを訓練することで、マイクロソフトは生成モデルのパラメータを探索するための新たな入り口を発見した。

大規模言語モデルのパラメータサイズは拡大しているものの、モデル内のパラメータがどのように機能するかを...

AI: データ駆動型企業への次のステップ

[[424113]]今日、ほとんどの人は、必要に応じて即座にビジネス イベントを感知し対応できる、デ...

定量評価、アルゴリズム拡張:強化学習研究の10原則

[[252430]]ビッグデータダイジェスト制作編纂者:江宝尚今年 9 月に開催された Deep L...