ニューラルネットワークアルゴリズムの利点と応用

ニューラルネットワークアルゴリズムの利点と応用

[[211834]]

人工ニューラル ネットワーク (ANN) は脳の処理メカニズムに基づいており、複雑なパターン構築および予測の問題に対するアルゴリズムを開発します。

まず、脳がどのように情報を処理するかを理解しましょう。

脳には、電気信号の形で情報を処理する何億ものニューロンがあります。外部の情報や刺激はニューロンの樹状突起で受信され、ニューロン細胞体で処理され、出力に変換され、軸索を通じて次のニューロンに伝達されます。次のニューロンは、信号の強度に応じて、それを受け入れるか拒否するかを選択できます。

それでは、ANN がどのように機能するかを理解してみましょう。

ここで、$w_1$、$w_2$、$w_3$は入力信号の強度を表す。

上でわかるように、ANN は脳のニューロンがどのように機能するかを表す非常に単純な構造です。

わかりやすくするために、簡単な例で ANN を理解しましょう。銀行は顧客への融資申請を承認するかどうかを評価したいので、顧客が融資を滞納する可能性があるかどうかを予測したいと考えています。以下のデータがあります:

したがって、列 X を予測する必要があります。予測値が 1 に近いほど、顧客が債務不履行になる可能性が高いことを示します。

次の例のニューロン構造に基づいて、人工ニューラル ネットワーク構造を作成してみてください。

通常、上記の例の単純な ANN 構造は次のようになります。

構造に関する重要なポイント:

  • ネットワーク アーキテクチャには、入力層、隠し層 (1 つ以上)、および出力層があります。多層構造のため、MLP(多層パーセプトロン)とも呼ばれます。
  • 隠し層は、入力からいくつかの重要なパターンを抽出し、次の層に渡す「蒸留層」と考えることができます。これにより、入力から重要な情報を識別し、冗長な情報を省略することで、ネットワークがより高速かつ効率的になります。
  • 活性化関数には 2 つの異なる目的があります。
    • 入力間の非線形関係を捉える
    • 入力をより有用な出力に変換するのに役立ちます。
    • 上記の例では、使用されている活性化関数はシグモイドです。
    • $$O_1=1+e^{-F}$$
    • ここで$F=W_1*X_1+W_2*X_2+W_3*X_3$
    • シグモイド活性化関数は、0 から 1 の間の出力を生成します。他にも Tanh、softmax、RELU などの活性化関数があります。
  • 同様に、隠れ層は出力層の最終予測を導きます: $$O_3=1+e^{-F_1}$$
  • ここで$F_1=W_7*H_1+W_8*H_2$
  • ここで、出力値($O_3$)は0〜1の範囲になります。 1 に近い値 (例: 0.75) は、顧客の債務不履行の可能性が高いことを示します。
  • 重み W は入力と有意な相関関係があります。 $w_1$ が 0.56 で $w_2$ が 0.92 の場合、$H_1$ を予測するには $X_2$:負債比率が $X_1$:年齢よりも重要になります。
  • 上記のネットワーク アーキテクチャは「フィードフォワード ネットワーク」と呼ばれ、入力信号が一方向 (入力から出力へ) にのみ送信されることがわかります。双方向に信号を渡す「フィードバック ネットワーク」を作成することが可能です。
  • 精度の高いモデルは、実際の値に非常に近い予測を提供します。したがって、上記の表では、列 X の値は列 W の値に非常に近くなるはずです。予測誤差は列 W と列 X の差です。

  1. 正確な予測を行う優れたモデルを得るための鍵は、予測誤差を最小限に抑える「重み W の最適値」を見つけることです。これは「バックプロパゲーション アルゴリズム」と呼ばれ、間違いから学習することでモデルが改善されるため、ANN は学習アルゴリズムになります。
  2. バックプロパゲーションの最も一般的な方法は勾配降下法と呼ばれ、W の異なる値を反復して予測誤差を評価します。したがって、最適な W 値を得るために、W 値を小さな範囲で変化させ、予測誤差の影響を評価します。最終的に、これらの W の値は最適として選択され、W をさらに変更してもエラーはそれ以上減少しません。勾配降下法の詳細については、以下を参照してください。

http://www.kdnuggets.com/2017/04/simple-understand-gradient-descent-algorithm.html

ニューラルネットワークの主な利点:

ANN には、特定の問題や状況に最適ないくつかの重要な利点があります。

  1. ANN には、非線形で複雑な関係を学習してモデル化する機能があります。これは、現実の世界では入力と出力の関係の多くが非線形で複雑であるため、非常に重要です。
  2. ANN は、初期入力とその関係から学習した後、一般化することができ、未知のデータ間の未知の関係を推測することもできるため、モデルは未知のデータを一般化して予測することができます。
  3. 他の多くの予測手法とは異なり、ANN は入力変数(たとえば、それらの分布方法)にいかなる制限も課しません。さらに、多くの研究により、ANN はデータに固定の関係を課すことなくデータ内の隠れた関係を学習できるため、不均一分散、つまり変動性が高く分散が不安定なデータをより適切にモデル化できることが示されています。これは、データが非常に変動しやすい金融時系列予測(株価など)に非常に役立ちます。

応用:

  1. 画像処理と文字認識: ANN は、多くの入力を受け取り、それらを処理して、隠れた複雑な非線形関係を推測する機能を備えています。ANN は、画像と文字の認識において重要な役割を果たします。手書き文字認識は、詐欺検出(銀行詐欺など)や国家安全保障評価など、さまざまな用途に使用されています。画像認識は、ソーシャル メディアでの顔認識から、医療における癌治療の安定化、農業や防衛目的の衛星画像の処理まで、幅広い用途を持つ成長分野です。現在、ANNの研究はディープニューラルネットワークへの道を切り開き、「ディープラーニング」の基礎となり、無人運転車など、コンピュータービジョン、音声認識、自然言語処理などの分野で一連の刺激的なイノベーションを生み出しています。
  2. 予測: 予測は、経済政策や金融政策、金融市場や株式市場、日常のビジネス上の意思決定 (販売、製品間の資金配分、生産能力の稼働率など) において広い意味で必要とされます。多くの場合、予測の問題は複雑です。たとえば、株価の予測は、多くの基礎要因 (既知のものもあれば未知のものもある) を伴う複雑な問題です。従来の予測モデルでは、これらの複雑な非線形関係を考慮するのに限界があります。 ANN は、未知の特徴や関係性をモデル化して抽出する能力を備えているため、適切な方法で適用すれば強力な代替手段となります。さらに、これらの従来のモデルとは異なり、ANN は入力と残差の分布にいかなる制限も課しません。 LSTM や RNN を使用した予測の進歩など、さらなる研究が進行中です。

ANN は幅広い用途に使える強力なモデルです。これらはほんの一例ですが、医療、セキュリティ、銀行、金融、政府、農業、防衛などの分野で幅広く応用されています。

<<:  機械分野におけるLDAトピックモデルを説明する記事

>>:  金融ロボアドバイザーは3つのトレンドによって増加傾向にある

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

LSTM は惨めに失敗しました!ある少年が時系列モデルを使って恋人の感情を予測した4ページの論文を発表した。

[[430915]]ガールフレンドの感情は株式市場と同じくらい予測不可能です。違いは、多くの専門家...

ロボットの時代が来ます。私たちは全員失業してしまうのでしょうか?

[[415590]]ボストン・ダイナミクス社が開発したヒューマノイドロボット「アトラス」、ロボット...

...

データセキュリティの向上と人工知能の信頼性の向上

JD Discovery Research InstituteのTao Dacheng所長はかつて、...

人工知能は人間と同じくらい創造的になれるのでしょうか?

創造性は、芸術、文学、科学、技術など、斬新で価値があり、意義のある作品を生み出すことを可能にする人間...

AIは意識を発達させ始めているのでしょうか? OpenAI主任科学者の発言が論争を巻き起こし、大物の間で論争を巻き起こした

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

現在、CIOは企業におけるGenAIの応用価値を慎重に検討している。

ほとんどの CIO は、自社のビジネスがテクノロジーのトレンドに追いつくために GenAI の検討を...

自動化によって、採用担当者が大規模な適格な人材を特定する方法

AI ベースの自動化ツールは、候補者データを収集して処理し、候補者の調達、スクリーニング、多様性、そ...

自動運転の運用設計領域(ODD)に関する記事

2021年4月30日、SAEはJ3016「運転自動化分類」の第4版をリリースしました。これは、201...

Appleは10年間で28社のAI企業を売却。そのAI戦略は世間の注目を集めることだ!

10年前の2010年2月、同社初のバーチャルパーソナルアシスタントアプリであるSiriがApple...

JD.com は今後 10 年間で従業員の 50% を解雇するでしょうか?ジャック・マー氏も人工知能が仕事を奪うことについて言及している

最近、劉強東氏は、今後10年間でJD.comの従業員数を現在の16万人から8万人に減らし、1人当たり...

...

電気自動車や自動運転の普及にはエネルギー補給技術の限界を乗り越えなければならない

電気による輸送はますます多様化しています。そして、それは地球規模の持続可能な開発の文脈において重要な...

人工知能におけるGNNとは何ですか?

グラフディープラーニング(GDL)は有望な研究分野であり、グラフデータに基づいた学習や分析は非常に有...