勉強すると、学んだことを忘れてしまい、忘れた後にまた学ぶという悪循環に陥ってしまう、そんな気持ちになったことはありませんか。全部学んだのに、思い出せないんです。時々、学びたいことを何でも脳にコピーできるように、頭の中に記憶装置を埋め込みたいと思うことがあります。それはどんなに素晴らしいことでしょう。 機械学習はその一例です。多くの場合、私たちは学習プロセスで迷子になり、学習を続ける意欲を失ってしまいます。多くの概念を体系化する必要があります。しかし今日は、この分野をより早く理解するのに役立つ機械学習のすべての概念を紹介したいと思います。この投稿は、機械学習を始めたばかりの方にも、すでに実際に機械学習を使い始めている方にも適しています。 概要:
さっそく始めましょう! 機械学習の概念これらの各概念は、他のより小さな派生概念につながります。ここで、各用語の最も短くて簡単な定義を示します。 1. 動機 機械学習では、モデルとデータを比較するプロセスが動機によって決まるため、動機が重要です。機械学習の動機付けには 2 つのアプローチがあります。
2. 分類 他のことと同様に、機械学習アルゴリズムをトレーニングする方法はいくつかあり、それぞれに長所と短所があります。
3. 質問の種類 機械学習のカテゴリをさらに深く掘り下げると、次の 5 つのタイプの問題が存在します。
4. クラス 機械学習アルゴリズムは、パラメトリックとノンパラメトリックに分類できます。
ステップ 1: 関数 (f) の関数形式または形状、つまり f が線形であると仮定し、線形モデルを選択します。 ステップ 2: モデルを適合またはトレーニングするプログラムを選択します。これは線形関数のベータパラメータを推定することを意味します。一般的なアプローチは(通常の)最小二乗法です。
5. パフォーマンス分析 アルゴリズムのパフォーマンス分析は、アルゴリズムに必要なスペースと時間を計算するプロセスです。アルゴリズムのパフォーマンス分析では、次の基準が使用されます。
6. アルゴリズム ここからが機械学習の本当に楽しい部分です。機械学習を実践するためのヒントをいくつか紹介します。
7. デバッグ デバッグは、学習アルゴリズムに最適なハイパーパラメータのセットを選択する問題です。そのコンポーネントは次のとおりです。 クロス検証 — 統計分析の結果が独立したデータ セットにどの程度一般化できるかを評価するために使用される手法。クロス検証の 1 ラウンドでは、データ サンプルを補完的なサブセットに分割し、一方のサブセット (トレーニング セットと呼ばれる) で分析を実行し、もう一方のサブセット (検証セットまたはテスト セットと呼ばれる) で分析を検証します。 方法: Leave-p-out 交差検証、Leave-one-out 交差検証、k 分割交差検証、ホールドアウト法、および繰り返しランダムサンプリング検証。 ハイパーパラメータ - 学習プロセスを制御するために使用される値を持つパラメータ。対照的に、他のパラメータ(通常はノードの重み)の値はトレーニングを通じて学習されます。以下の方法を使用して最適化できます。 1) グリッド検索。従来のアプローチは、学習アルゴリズムのハイパーパラメータ空間の手動で指定されたサブセットを単純に徹底的に検索することです。 2) ランダム検索。単純にパラメータ設定をサンプリングし、高次元空間ではこれを固定回数実行する方が網羅的な検索よりも効率的であることがわかります。 3) 勾配ベースの最適化。特定の学習アルゴリズムでは、ハイパーパラメータに関する勾配を計算し、勾配降下法を使用してハイパーパラメータを最適化できます。 正規化 (早期停止) - 早期停止ルールは、学習者が過剰適合を開始する前に何回反復を実行できるかをガイドし、その後アルゴリズムを停止します。 過剰適合。これは、モデルがトレーニング データ内の詳細とノイズを学習するときに発生し、新しいデータに対するモデルのパフォーマンスにある程度影響します。 アンダーフィッティング。これは、モデルがトレーニング データから「学習不足」になり、一般化が不十分になり、予測の信頼性が低下する場合です。 ガイド。これは、復元を伴うランダム サンプリングを使用するテストまたは測定であり、より広いカテゴリの再サンプリング方法に該当します。ブートストラップ法は、サンプル推定値に精度の尺度(バイアス、分散、信頼区間、予測誤差など)を割り当てます。 袋詰め。これは、多数の決定木の予測を組み合わせたアンサンブル機械学習アルゴリズムです。 要約する上記の内容は基本的に機械学習の知識ポイントを全て網羅しています。学んだことを復習しないと、ある日完全に忘れてしまう可能性があります。上記の内容がお役に立てれば幸いです〜 |
>>: 人工知能のシンギュラリティに関する考察: 超知能 AI の倫理的問題は無視できない
[[408503]] 1. 2021 年上半期に AI でどのような新たなブレークスルーが達成されま...
コンピューター ビジョンであれ NLP であれ、ディープ ニューラル ネットワーク (DNN) は、...
序文プログラミングの分野では、「プログラム = データ構造 + アルゴリズム」というよく知られたルー...
2020年、新型コロナウイルスのせいで世界中の人々が恐怖におののいていることでしょう…しかし、これは...
[[405185]]人工知能の分野では、何十年もの間、コンピューター科学者が視覚、言語、推論、運動能...
翻訳者|朱 仙中レビュー | Chonglou導入携帯電話、気候センサー、金融市場取引、車両や輸送コ...
この記事は公式アカウント「Reading the Core」(ID: AI_Discovery)から...
半導体業界では長年にわたり、より多くのコンポーネントを単一のシステムオンチップ (SoC) に緊密に...
インテリジェントエージェントは人工知能分野の主要な研究テーマであり、非身体型知能と身体型知能に分けら...
クラスタリング アルゴリズムを適用するのは、最適なアルゴリズムを選択するよりもはるかに簡単です。 そ...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
「こんにちは。投資したいお金があります。期待収益は 6 ~ 10 ポイントです。1 年間投資したいと...
明らかな理由から、ワクチンの開発が現在最優先事項となっています。安全で効果的なコロナウイルスワクチン...