機械学習の未来はここにある:ガウス過程とニューラルネットワークは同等である

機械学習の未来はここにある:ガウス過程とニューラルネットワークは同等である

ガウス過程は以前から存在していましたが、それに対する関心が大きく再燃したのはここ 5 ~ 10 年ほどのことです。これは、ソリューションの計算の複雑さに一部起因しています。モデルでは行列の逆変換が必要なため、複雑さは O(n3) となり、高速化が困難です。このため、コンピューティング能力が非常に弱かったため、しばらくの間、解決が困難でしたが、過去数年間、ML を背景にした多大な研究と資金提供により、解決が大幅に可能になりました。

ガウス過程の最も優れた特徴の 1 つは、ニューラル ネットワークと非常によく似ていることです。実際、ガウス過程 (GP) は、そのパラメータが自身のパラメータよりも iid が高い単層完全接続ニューラル ネットワークと同等であることはよく知られています。

これについては明確にしておきたいのですが、以下に挙げる証拠は単純ですが、広範囲にわたる影響を及ぼします。中心極限定理は、一見複雑な現象を統一することができます。その場合、最もパフォーマンスの高いモデルは、その分野がまだ完全に成熟していない機械学習モデルのサブセットと見なすことができます。

はい、GP は常に研究されてきましたが、DNN を構成する非線形パターン (ジャンプなど) を特徴付けることができる深層ガウス過程 (特に、XOR ロジックをモデル化できる) が研究者によって開発されたのはここ数年のことです。したがって、この点から、非常に多くの利益があることがわかります。

私はこの証拠を調べたいと思っていましたが、それはかなり単純です。以下の記事は、Li 氏らによる Google Brain 新聞から引用したものです。この記事を非常に便利に作成していただいた Li 氏らに感謝いたします。

小さなシンボル

注意: 「media」のすべてに下付き文字を付けることはできません。そのため、アンダースコア (M_l) が表示されている場合は、下付き文字として l が付いた M を意味していると想定してください。つまり、Mi + m

隠し幅 N_l (層 L の場合) を使用して L 層を持つ完全に接続されたニューラル ネットワークを考えます。 x∈Rdɪをネットワークへの入力とし、zlをその出力(層L)とする。 l 番目の層の i 番目の活性化コンポーネントは、xli および zli として表されます。 l 番目の層の重みとバイアス パラメータの iid 値はゼロであり、バイアス パラメータは平均がゼロで σ 2_w/N_l であると想定されます。

[[351436]]
> Unsplash の Maximalfocus による写真

ニューラルネットワーク

これで、ニューラル ネットワーク出力の i 番目のコンポーネント (zli) は次のように計算されることがわかりました。

入力 x への依存性を示します。重みとバイアスパラメータは iid であると想定されるため、xli と xli' の pos 活性化関数は j=/j' に対して独立です。

ここで、zli(x) は iid 項の合計であるため、中心極限定理に従います。したがって、無限幅 (N1->∞) の極限では、zli(x) もガウス分布になります。

ガウス過程

同様に、多次元 CLT から、任意の有限変数セット z は共同多変量ガウス分布になることが推測できます。これは、ガウス過程の正確な定義です。

したがって、zli(x)=GP(μ1,K1)は平均μ1と共分散K1を持つガウス過程であり、それ自体はiとは独立していると結論付けることができます。パラメータの平均はゼロなので、μ1=0ですが、K1(x, x')は次のようになります。

ここで、この共分散は、W0 と b0 の分布を積分することによって得られます。 i=/=j である任意の 2 つの zli と zlj は共分散がゼロの共ガウス分布であるため、隠れ層によって生成された同じ関数を使用しているにもかかわらず、独立していることが保証されることに注意してください。

[[351439]]
> 写真提供:バーミンガム博物館トラスト(Unsplash)

いくつかの証明は単純かつ論理的であり、中心極限定理の魔法は、すべてをガウス分布の下で統一することです。ガウス分布は、変数 (または次元) の周辺化と条件付けによってガウス分布が得られ、関数形式がかなり単純であるため、閉じた形式のソリューションに凝縮できるため (そのため、最適化手法はほとんど必要ありません)、優れています。

私の論理をどう思うか教えてください。疑問があれば質問してください。また、何か見落としている点があれば教えてください。

私の最新の記事を常にチェックしてください!

<<:  指紋、顔、虹彩: 適切な生体認証技術を選択するには?

>>:  人工知能が人間に危害を加えた場合、誰が責任を負わされるのでしょうか?

ブログ    

推薦する

...

自動運転車は見たことのない物体を避けることができないのか?問題はトレーニングパイプラインにある

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

高校生のアルゴリズム「y-cruncher」が円周率の精度の世界記録を更新した

最近、スイスのグラウビュンデン応用科学大学のチームが、円周率の62.8兆桁の計算を101日と9時間で...

AIが安全な生産のインテリジェントな監視を実現する方法

生産における安全は社会発展の永遠のテーマであり、すべての仕事の本質です。工業製造企業の場合、事業継続...

人工知能が企業発展の原動力となる

新しいコンセプトが実行可能なビジネスツールになると、多くの企業がそのテクノロジーを積極的に採用して市...

まだ気づいていないかもしれませんが、AIが人間を助けているアプリケーショントップ10

人工知能 (AI) 技術を使用すると多くのメリットがもたらされますが、その 1 つは、社会問題を別の...

IT 労働者の皆さん、AI があなたの仕事を「奪う」ためにやって来ています!今回はデータセンターからスタートします

[[349442]]人工知能に関する議論は現在、自動運転車、チャットボット、デジタルツイン、ロボット...

杭州妻殺害事件解決、警察AIも貢献

7月25日、杭州公安局は「杭州人妻殺害事件」について記者会見を開き、捜査結果を発表した。ネットユーザ...

開発が急ピッチで進む、医療ロボットには大きな可能性がある

今日の社会では、ロボットはますます人間とつながるようになっています。産業用ロボットが組立ラインで忙し...

ICRA 2022 優秀論文: 自動運転用 2D 画像を鳥瞰図に変換し、モデル認識精度を 15% 向上

自動運転における多くのタスクは、トップダウン、マップ、または鳥瞰図 (BEV) の観点から見ると、よ...

人工知能は仕事をなくしてしまうのでしょうか?マスク氏の提案を聞いてみましょう。

人工知能が広く活用されるようになり、将来の雇用環境に対する不安も広がっています。 2019年に調査会...

【コレクション】貢献度が最も高い GitHub コレクションとディープラーニング フレームワーク 16 選

ディープラーニングは、データの経験的学習に基づく機械学習手法であり、近年発展し、人気が高まっています...

...