ディープラーニングは本質的には深層人工ニューラルネットワークです。これは孤立した技術ではなく、数学、統計的機械学習、コンピューターサイエンス、人工ニューラルネットワークなどの複数の分野を統合したものです。ディープラーニングの理解は、学部数学における最も基本的な数学的分析(高度な数学)、線形代数、確率論、凸最適化と切り離せないものであり、ディープラーニング技術の習得は、プログラミングを中核とした実践的な実践と切り離せないものです。数学とコンピューターサイエンスの確固たる基盤がなければ、ディープラーニングにおける技術的な進歩は空想に過ぎません。 したがって、ディープラーニング技術で成功したい初心者にとっては、ディープラーニングに対するこれらの基礎知識の重要性を理解する必要があります。さらに、私たちのプロフェッショナルパスでは、構造と最適化の理論的側面からディープラーニングの基礎を紹介し、ディープラーニングフレームワークの実践に基づいて高度なパスを簡単に分析します。 ***、この記事ではディープラーニングの実践体験やディープラーニングに関する最先端の情報を入手した体験もシェアします。 数学の基礎 ディープラーニングの論文の数式を流暢に理解し、独自に新しい手法を導き出すことができれば、必要な数学的基礎を身に付けていることになります。 数学解析、線形代数、確率論、凸最適化の 4 つの数学コースに含まれる数学的知識を習得し、機械学習の基本的な理論と手法に精通することが、ディープラーニング技術を始めるための前提条件です。なぜなら、ディープネットワークの各層の動作と勾配導出を理解するにしても、問題を形式化するにしても、損失関数を導出するにしても、数学と機械学習の確固たる基礎と切り離せないからです。
コンピュータの基礎 ディープラーニングには実際の練習が必要なので、GPU サーバーのハードウェア選択に関する知識、Linux システムとシェル プログラミングの熟練度、C++ と Python の知識は、ディープラーニングの専門家になるための前提条件です。現在、「フルスタックディープラーニングエンジニア」という用語がありますが、これはディープラーニングの実践者に求められる実践能力のレベルを反映したものでもあります。ディープラーニングには、数学と機械学習の強力な理論的基礎だけでなく、コンピュータープログラミングの熟練度と必要なアーキテクチャ知識も必要です。
ディープラーニング入門 次に、ディープラーニングの入門を理論と実践の両面から紹介します。
畳み込みニューラル ネットワークを例に、図 2 を使用して、開始するために習得する必要がある知識を示します。出発点はヒューベルとヴィーゼルによる猫の視覚皮質の研究であり、その後、日本の学者福島邦彦の神経認知機械モデル(畳み込み構造はすでに登場していた)へとつながっていったが、最初のCNNモデルが誕生したのは1989年、そして後に誰もが知ることになるLeNetが誕生したのは1998年であった。 ReLU と Dropout の導入、そして GPU とビッグデータによってもたらされた歴史的な機会により、CNN は 2012 年に歴史的なブレークスルー、つまり AlexNet ネットワーク構造の誕生をもたらしました。 2012 年以降、CNN の進化の道筋は、1. より深いネットワーク、2. 畳み込みモジュールの機能強化と、上記 2 つのアイデア、ResNet とそのバリエーションの統合、3. 分類から検出まで、最も重要な進歩は ICCV 2017 の Best Paper Mask R-CNN でした、4. 新しい機能モジュールの追加、の 4 つの部分にまとめることができます。
最初にフレームワークを習得した後は、特定の研究問題に基づいてさらに改善する必要があります。迅速かつ簡単な戦略としては、まず自分の分野の権威あるベンチマークをざっと確認してみることです。たとえば、顔認識の分野ではLFWやMegaFace、画像認識や物体検出の分野ではImageNetやMicrosoft COCO、画像セグメンテーションの分野ではPascal VOCなどが挙げられます。他の人の手法を再現または改良し、データの準備、モデルのトレーニング、パラメータの調整を自分で実践することで、自分の分野のベンチマークで現在の最高の結果を達成でき、実践への導入が最初に完了します。 その後の進歩には、実際の戦闘での継続的な探求と改善が必要です。たとえば、大規模なトレーニング データの処理に熟練していること、精度と速度のバランスに熟練していること、パラメーター調整技術を習得していること、他の人の作業を迅速に再現または改善できること、新しい方法を実装できることなどです。 ディープラーニングの実践経験 ここでは、ディープラーニングの実践的な経験を 4 つの側面から共有します。 1. 十分なデータ。大量のラベル付きデータは依然としてディープラーニング モデルの精度を本質的に左右するため、すべてのディープラーニング実践者はデータが非常に重要であることを認識する必要があります。データの入手方法は、オープンデータ(ImageNetやLFWなど、主に学術界向けに公開されているもの)、第三者データ企業からの有料データ、自社のビジネスと組み合わせて生成したデータの3つが主流です。 2. 優れたプログラミング実装能力。ディープラーニング アルゴリズムの実装には熟練したプログラミング スキルが必要であり、Python プログラミングの熟練がその基礎となります。基盤となる実装をさらに変更したり、新しいアルゴリズムを追加したりする場合は、基盤となるコードを変更する必要がある場合があります。このとき、熟練した C++ プログラミング スキルが不可欠になります。明らかな現象として、かつてはコンピューター ビジョンの研究者がこの分野で成功するために Matlab を習得するだけで済んだのに、今では Python と C++ を学ぶために追加のクラスを受講する必要があるということがあります。 3. 十分な GPU リソース。ディープラーニングモデルのトレーニングには、豊富な GPU リソースが必要です。複数のマシンと複数の GPU でモデルを並列実行することで、モデルの収束速度を効果的に向上させ、アルゴリズムの検証とパラメータの調整をより迅速に完了できます。ディープラーニングを専門とする企業や研究室では、数十から数百の GPU リソースを保有するのが一般的です。 4. 革新的な方法。ディープラーニングの分野で権威のあるImageNetコンペティションを例に挙げてみましょう。ディープラーニング技術が2012年にコンペティションで優勝してから2017年の最初のコンペティションまで、方法論の革新は常にディープラーニングの進歩の原動力となってきました。少しデータを追加したり、ネットワークを深くしたり、いくつかの SGD パラメータを調整したりするだけで満足する場合、真に優れた結果を達成することは困難です。 私自身の経験から言うと、方法論の革新は確かに驚くべき結果をもたらすことができます。アリババが主催する天地画像検索コンテストに参加した際、私はラベル付けされたノイズの多いデータに新しい損失関数を使用するという革新的な提案をしました。その結果、ディープモデルの精度が大幅に向上し、その年の優勝を果たしました。 ディープラーニングの最先端 【最先端情報の発信源】 実戦での技術力を向上させるには、ディープラーニングの最新の進歩を理解する必要があります。つまり、論文をブラッシュアップするということです。Arxivを定期的にブラッシュアップし、代表的著作のGoogle Scholar引用をブラッシュアップし、ICCV、CVPR、ECCVなどの主要なカンファレンスに注目するほか、ZhihuのDeep LearningコラムやRedditで主要な論文(または素晴らしい不満)について随時議論します。 Valse 最先端技術選抜、ディープラーニング講堂、Paper Weekly などの高品質な公開アカウントは、最先端のディープラーニング技術を頻繁に推進しており、情報源にもなります。同時に、LeCunやBengioなどの学術界の巨匠たちのFacebook/Quoraのホームページをフォローしたり、Weiboのアカウント「爱可可爱生活」などをフォローしたりすると、驚くような発見をすることがよくあります。 【おすすめフォーカス】
|
<<: 機械学習にはどのプログラミング言語を選択すればよいでしょうか?
>>: それは大したことだ! Google によれば、人類は 2029 年に不死を達成するそうです。病気も老化も痛みも完全に消え去ります! ?
インターネット データ センターの最新の消費者ガイド分析によると、2021 年から 2025 年の期...
[51CTO.com オリジナル記事] DataPipeline の AI 責任者である Wang...
[[198103]] 1. オンライン機能システム主流のインターネット製品では、古典的な計算広告、検...
エッジコンピューティングと人工知能の組み合わせにより、エッジ AI は現在のテクノロジー市場における...
著者 | 崔昊レビュー | ChonglouまとめAutoGenはAIをベースにしている 人間の意思...
先ほど、2023年未来科学賞の受賞者が発表されました!今年の「数学およびコンピューターサイエンス賞」...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[317093]]モザイクは、一般的に広く使用されている画像/ビデオ処理方法であり、画像/ビデオ内...
人工知能チャットボット「ChatGPT」は最近非常に人気が高まっており、あらゆるメディアでそのニュー...
博士号取得のために勉強するべきか、しないべきか、それが問題だ。 [[354586]]博士号を取得すべ...
以前は、機械学習に少しイライラしていました。一方では、メディアやトレーニング機関が機械学習を汎用人工...