活性化関数(変換関数とも呼ばれる)は、ニューラル ネットワークを設計するための鍵となります。活性化関数は、ニューラル ネットワークの出力を決定するために使用されるという意味で重要です。結果の値は、関数に応じて 0 から 1 または -1 から 1 などにマッピングされます。活性化関数にはスクワッシング関数と呼ばれる別名があり、活性化関数の範囲が制限されている場合に使用されます。活性化関数はニューラル ネットワークの各ノードに適用され、そのニューロンを「発火」/「活性化」するかどうかを決定します。 活性化関数を選択することがなぜ重要なのか。 活性化関数の選択は、隠し層と出力層に実装するときに重要です。モデルの精度と損失は活性化関数に大きく依存します。さらに、モデルに対する期待に基づいて選択する必要があります。たとえば、バイナリ分類問題では、シグモイド関数が最適な選択です。 活性化関数のタイプ。これらは大まかに 2 つのカテゴリに分けられます。 線形活性化関数。 非線形活性化関数。 表示の便宜上、次のライブラリをインポートします。
シグモイドシグモイド活性化関数はロジスティック関数とも呼ばれます。シグモイド関数は回帰問題や分類問題で非常によく使用されます。シグモイド関数によって与えられる値の範囲は 0 から 1 です。
タンHこの関数はシグモイド活性化関数と非常によく似ています。この関数は、-1 から 1 の範囲の任意の実数値を入力として受け入れ、任意の実数値を出力します。入力が大きい (正の値が大きい) ほど、出力値は 1.0 に近くなり、入力が小さい (負の値が大きい) ほど、出力は -1.0 に近くなります。 Tanh 活性化関数は次のように計算されます。
ソフトマックスSoftmax 活性化関数は、合計が 1.0 になる値のベクトルを出力します。これは、クラス メンバーシップの確率として解釈できます。 Softmax は、尤度出力の「勝者がすべてを獲得する」機能を可能にする argmax 関数の「ソフト」バージョンです。
RELU 整流器リニアユニットReLU はおそらく、隠し層に使用される最も一般的な関数です。また、Sigmoid や Tanh など、以前によく使われていた他の活性化関数の制限を効果的に克服することもできます。具体的には、飽和ユニットなどの他の問題が発生する可能性はあるものの、深層モデルのトレーニングを妨げる勾配降下法消失問題の影響は受けにくくなります。
リーキーReLUReLU の問題: ReLU に負の値が与えられると、すぐにゼロになり、モデルがデータから適切に適合またはトレーニングする能力が低下します。つまり、ReLU 活性化関数への負の入力は、グラフ内でその値を即座にゼロに変換し、その結果、負の値が不適切にマッピングされて結果のグラフに影響を及ぼします。 この問題を克服するために、Leaky ReLU が導入されました。
以下の関数はすべて RELU のバリエーションです。基本的には Leaky に似ており、活性化関数が負の場合に戻り値を最適化します。 エル
セル
シュッシュ
要約するよく使われる隠れ層の活性化関数: 一般的に、リカレント ニューラル ネットワークでは Tanh またはシグモイド活性化関数、あるいはその両方が使用されます。たとえば、LSTM では通常、再帰接続にシグモイド活性化を使用し、出力に Tanh 活性化を使用します。 1. 多層パーセプトロン (MLP): ReLU 活性化関数。 2. 畳み込みニューラル ネットワーク (CNN): ReLU 活性化関数。 3. リカレント ニューラル ネットワーク: Tanh および/またはシグモイド活性化関数。 どの活性化関数を使うべきかわからない場合は、さまざまな組み合わせを試して最適なものを見つけることもできますが、まずはRELUから始めることができます。 出力層の活性化関数: 出力層の活性化関数は、解決しようとしている問題の種類に基づいて選択する必要があります。たとえば、線形回帰の問題がある場合、線形活性化関数が役立ちます。以下は、直面する可能性のある一般的な問題と、使用されるアクティベーション関数です。 バイナリ分類: 1 つのノード、シグモイド活性化。 マルチクラス分類: クラスごとに 1 つのノード、ソフトマックス活性化。 マルチラベル分類: クラスごとに 1 つのノード、シグモイド活性化。 以下は、よく使用される活性化関数の数式と視覚化です。お役に立てば幸いです。 |
<<: これはホログラムではありません!多角度から視聴できる真の3D画像
時計職人の片眼鏡から、絵を描くのに便利な「ルシーダカメラ」まで、職人たちは光学技術を使って感覚を高め...
[[391671]]気候変動は今日世界が直面している最大の課題となっています。国連は、2021年が地...
1. 概要: 一般的 = 非効率的汎用プロセッサであるCPU(中央処理装置)は、コンピュータに欠か...
人工知能アルゴリズムやディープラーニングなどのさまざまな技術の徹底的な発展により、人工知能(AI)は...
Microsoft は、仮想会議用に Mesh for Teams と呼ばれる没入型 3D プラット...
ラボガイドインターネットの発展により、企業はより多くのデータを入手できるようになりました。これらのデ...
顔認識技術はもともとSFの世界のコンセプトでした。しかし、過去 10 年間で、顔認識技術は現実のもの...
[[202181]] 2015年、同社のエンジニアリング担当副社長であるXavier Amatri...
認知技術は世界最大の課題を解決するために使用されています。この記事では、企業が認知 AI をどのよう...
たった1日で、OpenAIの取締役会は劇的に変化しました。最新のニュースによると、ウルトラマンがCE...
生成 AI、特に ChatGPT は、技術系プレス、主流メディア、そしてほぼすべての分野の専門家の間...
シェルが2013年に初めて「AI Center of Excellence」を立ち上げたとき、それは...
AI は、自動運転車、より優れたルートマッピング、より正確な予測を通じて、輸送と物流をよりスマートか...