この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 私たちの生活において、天体観測から MP3 プレーヤーのスペクトルまで、すべてはフーリエ変換なしでは不可能でしょう。 簡単に言えば、離散フーリエ変換 (DFT)とは、複雑な波形を異なる周波数成分に分割することです。 たとえば、音波レコーダーを使用して音を表示すると、実際には、生活の中での音のほとんどは非常に複雑で、混沌としています。 フーリエ変換により、これらの混沌とした音波は正弦波に変換され、私たちが普段目にする音楽スペクトルの姿になります。 しかし、実際の計算では、このプロセスは実は非常に複雑です。 音波を連続関数とみなすと、一連の三角関数の重ね合わせとして一意に表現できます。ただし、重ね合わせのプロセスでは、各三角関数の重み係数が異なります。増やす必要があるものもあれば、減らす必要があるものもあり、増やす必要がないものもあります。 フーリエ変換は、これらの三角関数とそれぞれの重みを求めることです。 なんと偶然でしょう!この検索プロセスはニューラル ネットワークと非常によく似ています。 ニューラル ネットワークの本質は、実際には関数を近似することです。
これは実際に実現可能であり、最近誰かが彼のトレーニングプロセスと結果をオンラインで投稿しました。 DFT = ニューラルネットワークニューラルネットワークをトレーニングするにはどうすればいいですか?このネットユーザーが提示したアイデアは以下の通り。 まず、離散フーリエ変換 (DFT) を人工ニューラル ネットワークとして考えます。これは、バイアスや活性化関数がなく、重みに特定の値を持つ単層ネットワークです。出力ノードの数は、フーリエ変換計算後の周波数の数に等しくなります。 具体的な方法は以下の通りです。 これが DFT です:
信号はすべての正弦波信号の合計として表すことができます。 yk は、信号 x 内の周波数 k の正弦波に関する情報を提供する複素値です。yk から正弦波の振幅と位相を計算できます。 行列形式では、次のようになります。 以下は、k の特定の値に対するフーリエ値です。 ただし、通常は、完全なスペクトル、つまり [0,1,...N-1] の k の値を計算します。これは、行列で表すことができます (k は列ごとに増加し、n は行ごとに増加します)。 簡略化すると次のようになります。 これは、バイアスとアクティベーション関数のないニューラル ネットワーク層なので、見覚えがあるはずです。 指数行列には、複素フーリエ重みと呼ばれる重みが含まれています。通常、ニューラル ネットワークの重みはわかりませんが、ここではわかります。
ニューラル ネットワークでは通常、複素数は使用しません。これに対応するには、行列のサイズを 2 倍にして、左側に実数が含まれ、右側に虚数が含まれるようにする必要があります。 意思 DFT に代入すると次のようになります。 次に、実数部 (余弦形式) を使用して行列の左半分を表し、虚数部 (正弦形式) を使用して行列の右半分を表します。 簡略化すると次のようになります。 意思 これをフーリエ重みといいます。 y^とyは実際には同じ情報を含んでいるが、y^ 複素数は使用されていないため、長さは y の 2 倍になります。 つまり、 または 振幅と位相を表すが、通常は ここで、ネットワークにフーリエ層を追加します。 フーリエ重みを使用してフーリエ変換を計算するニューラルネットワークを使って実装できるようになりました 高速フーリエ変換 (FFT) を使用して正しいことを確認します。
得られた小さな誤差値は、計算された結果が目的のものであることを証明します。
最後に、DFT 後の正弦波信号から再構成された信号と元の信号がうまく重なり合っていることがわかります。 勾配降下法によるフーリエ変換の学習ここで、ニューラル ネットワークが実際に学習する部分が来ます。このステップでは、以前のように重みを事前に計算する必要はありません。 まず、FFT を使用してニューラル ネットワークをトレーニングし、離散フーリエ変換を学習します。
結果は上記の通りであり、ニューラル ネットワークが実際に離散フーリエ変換を学習できることが確認されています。 DFTを学習するためのネットワークのトレーニング高速フーリエ変換法を使用するだけでなく、ネットワークを通じて入力信号を再構築することによって DFT を学習することもできます。 (オートエンコーダと同様)。 オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(ANN)の一種です。その機能は、入力情報を学習対象として、入力情報に対する表現学習を行うことです。
著者はこのモデルで多くのテストを実行しましたが、最終的に得られた重みは上記の例ほどフーリエ重みに近いものではありませんが、再構築された信号は一貫していることがわかります。 代わりに振幅と位相を入力してみましょう。
再構築された信号が再び一貫していることがわかります。 ただし、前と同様に、振幅と位相を入力して得られる最終的な重みは、フーリエ重みとまったく同じではありません(ただし、非常に近い値になります)。 このことから、最終的な重みは最も正確ではないものの、局所的な最適解が得られるという結論が導き出されます。 このようにして、ニューラル ネットワークはフーリエ変換を学習しました。
まず、計算された重みが実際のフーリエ重みとどの程度異なるかが説明されていません。 さらに、モデルにフーリエ層を含めることでどのような利点が得られるのかは明らかではありません。 |
<<: 「コピー+貼り付け」に別れを告げ、ディープラーニングOCRに基づくPDFからテキストへの変換を実現
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
水中ロボットが極地でその能力を披露[[439571]]科学研究員らが甲板上で展開準備を進めている...
人力の60倍の速さで作業する送電線検査画像「認識者」、ベテラン並みの監視ビデオ「品質検査員」、さまざ...
子どもを指導しているとき、圧倒されたり、怒りすぎて気が狂いそうになったりすることがありますか? [[...
[[255964]]人工知能(AI)の急速な進歩と発展により、その二重用途やセキュリティリスクについ...
[[187947]] 2017 年の最初の 1 ~ 2 か月間、2017 年のテクノロジー トレン...
10月16日、既存の大規模言語モデルをさまざまなユーザーニーズに合わせて修正することで、関連モデルの...
人工知能 (AI) は、現在、デジタル マーケティング革命における否定できないトレンドとなっています...
[[252207]] [51CTO.com クイック翻訳] Juliaは2018年に登場し、現在最...
中国人工知能産業発展連盟メディアプロジェクトグループの設立会議が2018年1月25日に北京で開催され...
[[425002]]自然言語理解 (NLU) は難しい問題です。数十年前の AI の誕生から現在に至...
データ分析オムニチャネルコマースが拡大するにつれ、広告分析の状況は劇的に変化しようとしています。オン...
近年、AI 音声ジェネレーターは、人々が機械と対話し、デジタル コンテンツを受け取る方法を変える強力...