機械学習の未来はここにある:ガウス過程とニューラルネットワークは同等である

機械学習の未来はここにある:ガウス過程とニューラルネットワークは同等である

ガウス過程は以前から存在していましたが、それに対する関心が大きく再燃したのはここ 5 ~ 10 年ほどのことです。これは、ソリューションの計算の複雑さに一部起因しています。モデルでは行列の逆変換が必要なため、複雑さは O(n3) となり、高速化が困難です。このため、コンピューティング能力が非常に弱かったため、しばらくの間、解決が困難でしたが、過去数年間、ML を背景にした多大な研究と資金提供により、解決が大幅に可能になりました。

ガウス過程の最も優れた特徴の 1 つは、ニューラル ネットワークと非常によく似ていることです。実際、ガウス過程 (GP) は、そのパラメータが自身のパラメータよりも iid が高い単層完全接続ニューラル ネットワークと同等であることはよく知られています。

これについては明確にしておきたいのですが、以下に挙げる証拠は単純ですが、広範囲にわたる影響を及ぼします。中心極限定理は、一見複雑な現象を統一することができます。その場合、最もパフォーマンスの高いモデルは、その分野がまだ完全に成熟していない機械学習モデルのサブセットと見なすことができます。

はい、GP は常に研究されてきましたが、DNN を構成する非線形パターン (ジャンプなど) を特徴付けることができる深層ガウス過程 (特に、XOR ロジックをモデル化できる) が研究者によって開発されたのはここ数年のことです。したがって、この点から、非常に多くの利益があることがわかります。

私はこの証拠を調べたいと思っていましたが、それはかなり単純です。以下の記事は、Li 氏らによる Google Brain 新聞から引用したものです。この記事を非常に便利に作成していただいた Li 氏らに感謝いたします。

小さなシンボル

注意: 「media」のすべてに下付き文字を付けることはできません。そのため、アンダースコア (M_l) が表示されている場合は、下付き文字として l が付いた M を意味していると想定してください。つまり、Mi + m

隠し幅 N_l (層 L の場合) を使用して L 層を持つ完全に接続されたニューラル ネットワークを考えます。 x∈Rdɪをネットワークへの入力とし、zlをその出力(層L)とする。 l 番目の層の i 番目の活性化コンポーネントは、xli および zli として表されます。 l 番目の層の重みとバイアス パラメータの iid 値はゼロであり、バイアス パラメータは平均がゼロで σ 2_w/N_l であると想定されます。

[[351436]]
> Unsplash の Maximalfocus による写真

ニューラルネットワーク

これで、ニューラル ネットワーク出力の i 番目のコンポーネント (zli) は次のように計算されることがわかりました。

入力 x への依存性を示します。重みとバイアスパラメータは iid であると想定されるため、xli と xli' の pos 活性化関数は j=/j' に対して独立です。

ここで、zli(x) は iid 項の合計であるため、中心極限定理に従います。したがって、無限幅 (N1->∞) の極限では、zli(x) もガウス分布になります。

ガウス過程

同様に、多次元 CLT から、任意の有限変数セット z は共同多変量ガウス分布になることが推測できます。これは、ガウス過程の正確な定義です。

したがって、zli(x)=GP(μ1,K1)は平均μ1と共分散K1を持つガウス過程であり、それ自体はiとは独立していると結論付けることができます。パラメータの平均はゼロなので、μ1=0ですが、K1(x, x')は次のようになります。

ここで、この共分散は、W0 と b0 の分布を積分することによって得られます。 i=/=j である任意の 2 つの zli と zlj は共分散がゼロの共ガウス分布であるため、隠れ層によって生成された同じ関数を使用しているにもかかわらず、独立していることが保証されることに注意してください。

[[351439]]
> 写真提供:バーミンガム博物館トラスト(Unsplash)

いくつかの証明は単純かつ論理的であり、中心極限定理の魔法は、すべてをガウス分布の下で統一することです。ガウス分布は、変数 (または次元) の周辺化と条件付けによってガウス分布が得られ、関数形式がかなり単純であるため、閉じた形式のソリューションに凝縮できるため (そのため、最適化手法はほとんど必要ありません)、優れています。

私の論理をどう思うか教えてください。疑問があれば質問してください。また、何か見落としている点があれば教えてください。

私の最新の記事を常にチェックしてください!

<<:  指紋、顔、虹彩: 適切な生体認証技術を選択するには?

>>:  人工知能が人間に危害を加えた場合、誰が責任を負わされるのでしょうか?

ブログ    
ブログ    

推薦する

DeepMind がワンクリックで「Mole」言語モデルを起動します。 2,800億のパラメータがSOTAに到達可能

太い眉毛と大きな目を持つ「強化学習の専門家」も、大規模言語モデルに取り組み始めているのでしょうか? ...

言語モデルの倫理的・社会的リスクについて

このホワイトペーパーでは、6 つの具体的なリスク領域について概説しています。I. 差別、排除、毒性、...

ロボットに25分で6つの動作を学習させるトレーニング、バークレーは効率的なロボット操作フレームワークを開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIビジョンを取り入れることで、ガソリンスタンドは非常に「スマート」になることができます

[[354264]]石油貯蔵所、ガソリンスタンド、石油荷降ろしトラックには大量の完成燃料が保管され...

コンピュータービジョンを使用してフィッシング攻撃を検出するにはどうすればよいでしょうか?

好きでも嫌いでも、あるいは恐れていても、ChatGPT に代表される新興の人工知能 (AI) プラッ...

...

AIドクターは正式に勤務中ですか? AIと医療の融合が爆発点に到達!

近年、医療分野における人工知能の応用が非常にホットな話題となっています。 「ニューイングランド・ジャ...

AIストレージアーキテクチャの構築方法

今日、データの処理と保存に関する懸念が高まっています。生成されるデータの量、データが作成される場所、...

半年以上前から推進されてきたGoogleの次世代AIアーキテクチャとジェフ・ディーンのPathwaysがついに論文化

現在の AI システムが直面している問題について議論する際、非効率性はよく言及されるものの 1 つで...

人間が理解できる音声を合成するために、機械はどのような「ディープラーニング」を行っているのでしょうか?

ディープラーニングは2006年に登場して以来、近年急速に発展し、学術研究と企業アプリケーションの両方...

ディープラーニング Pytorch フレームワーク Tensor

[[433522]] 1 テンソル刈り込み操作テンソル内の要素を範囲でフィルタリングする勾配クリッ...

人工知能のジレンマ:人々の疑問を払拭できない

[[255964]]人工知能(AI)の急速な進歩と発展により、その二重用途やセキュリティリスクについ...

...

WAVE SUMMITが今年もやって来ました! AI 開発者の饗宴がこの寒い冬を盛り上げます!

WAVE SUMMIT+ ディープラーニング開発者カンファレンス 2023 が 12 月 28 日...

合理性への回帰とアプリケーションとの統合 - AI時代のモバイル技術革新カンファレンス

人工知能の出現により、ますます多くの企業がそれを業務や生産に応用しています。新しいモバイル開発技術が...