本日公開したこの記事では、著者の Sonam Srivastava が金融分野におけるディープラーニングの 3 つの使用例と、これらのモデルの長所と短所の証拠について説明しています。 私たちは Sonam Srivastava 氏の分析に従い、金融分野におけるディープラーニングの応用の展望に期待しています。金融は最も計算集約的な分野ですが、広く使用されている金融モデル(教師ありモデル、教師なしモデル、状態ベースモデル、計量経済モデル、さらには確率モデル)はすべて、過剰適合やヒューリスティックな問題に悩まされており、サンプリング結果が不十分です。金融エコシステムは非常に複雑であるため、その非線形性には相互作用する多数の要因が満ちています。 これに対処するために、画像認識、音声認識、感情分析におけるディープラーニングに関する研究を検討すると、これらのモデルは大規模なラベルなしデータから学習し、過剰適合を避けるために簡単に調整できる非線形関係の再帰構造を形成できることがわかります。 金融エコシステムがこれらのネットワークをモデリングに使用できれば、その応用分野は広範囲に及ぶでしょう。これらのモデルは、価格設定、ポートフォリオ構築、リスク管理、さらには高頻度取引などの分野で使用できます。これらの問題に取り組みましょう。 収益予測 毎日の金価格を予測するサンプリング問題を例に、まず従来のアプローチを見てみましょう。 ARIMAモデル ARIMA モデル (自己回帰積分移動平均モデル) は、微分積分移動平均自己回帰モデル、積分移動平均自己回帰モデル (移動はスライディングとも呼ばれる) とも呼ばれ、時系列予測および分析方法の 1 つです。 ARIMA (p, d, q) では、AR は「自己回帰」を表し、p は自己回帰項の数です。MA は「移動平均」を表し、q は移動平均項の数、d は定常系列にするために行われた差 (順序) の数です。 ARIMA の英語名には「差異」という言葉は出てきませんが、これは重要なステップです。 ARIMA モデルの基本的な考え方は、予測対象が時間の経過とともに形成するデータ シーケンスをランダム シーケンスと見なし、特定の数学モデルを使用してこのシーケンスを近似することです。このモデルが特定されると、時系列の過去と現在の値から将来の値を予測できるようになります。現代の統計手法と計量経済モデルは、企業が将来を予測するのにある程度役立っています。統合移動平均自己回帰モデルを使用して季節定常時系列を予測すると、次の図に示す結果が得られます。 VARモデル VAR モデル (ベクトル自己回帰モデル) ベクトル自己回帰モデルは、計量経済学者でマクロ経済学者の Christopher Sims によって提案された、一般的に使用されている計量経済モデルです。これは、1 つの変数しか使用できない自己回帰モデル (略して AR モデル) を複数の変数に対応できるように拡張したもので、多変量時系列モデルの解析でよく使用されます。 相関予測変数を自己回帰モデルに追加し、ベクトル自己回帰モデルに移行すると、次の図に示す結果が得られます。 深層回帰モデル 同じ入力でデータに単純な深層回帰モデルを使用すると、次の図に示すように、はるかに優れた結果が得られます。 畳み込みニューラルネットワーク 畳み込みニューラル ネットワーク (CNN) は、人工ニューロンが特定のカバレッジ領域内の周囲のユニットに応答でき、大規模な画像処理で優れたパフォーマンスを発揮するフィードフォワード ニューラル ネットワークです。 畳み込みニューラル ネットワークは、1 つ以上の畳み込み層と最上部の完全接続層 (従来のニューラル ネットワークに対応)、および関連する重みとプーリング層で構成されます。この構造により、畳み込みニューラル ネットワークは入力データの 2 次元構造を活用できるようになります。他のディープラーニング構造と比較して、畳み込みニューラル ネットワークは画像認識と音声認識においてより優れた結果をもたらすことができます。このモデルは、バックプロパゲーション アルゴリズムを使用してトレーニングすることもできます。他のディープ フィードフォワード ニューラル ネットワークと比較すると、畳み込みニューラル ネットワークは考慮すべきパラメーターが少ないため、魅力的なディープラーニング構造となっています。 アーキテクチャを変更し、畳み込みニューラル ネットワークを使用して同じ問題を解決すると、結果は次のようになります。 得られた結果は大幅に改善されました。しかし、最悪の事態はまだ来ていない。 長期短期記憶ネットワーク Long Short-Term Memory (LSTM) は時間再帰ニューラル ネットワーク (RNN) であり、その論文は 1997 年に初めて発表されました。 LSTM は、その独自の設計構造により、非常に長い間隔と遅延を持つ時系列内の重要なイベントの処理と予測に適しています。 LSTM は、多くの場合、非セグメント化連続手書き認識などにおいて、時間再帰ニューラル ネットワークや隠れマルコフ モデル (HMM) よりも優れたパフォーマンスを発揮します。 2009 年、LSTM で構築された人工ニューラル ネットワーク モデルが ICDAR 手書き認識コンテストで優勝しました。 LSTM は自律音声認識にも広く使用されており、2013 年には TIMIT 自然音声データベースを使用して 17.7% という記録的なエラー率を達成しました。非線形モデルとして、LSTM は、より大規模なディープ ニューラル ネットワークを構築するための複雑な非線形ユニットとして使用できます。 リカレント ニューラル ネットワーク (RNN) のバリエーションを使用して、次の結果が得られました。 したがって、平均二乗誤差の傾向は全体的に予想外です。 ポートフォリオ構築 私たちがディープラーニングを使って解決しようとしている 2 番目の金融問題は、ポートフォリオの構築です。この問題にはディープラーニングの実用的応用が非常に有効です。私の研究は、この論文「Deep Portfolio」(https://0x9.me/8uOBt)に触発されました。 この論文の著者は、時系列をそれ自体にマッピングするオートエンコーダーの構築を試みています。これらのオートエンコーダを使用した予測誤差は、株式のベータ(市場と相関)の代理となり、オートエンコーダは市場のモデルとして機能します。 オートエンコーダは、主にデータの次元削減や特徴抽出に使用される教師なし学習アルゴリズムです。ディープラーニングでは、オートエンコーダを使用して、トレーニングフェーズが始まる前に重み行列 W の初期値を決定できます。上記のオートエンコーダーのエラーに基づいて異なる株を選択し、別のディープ ニューラル ネットワークを使用してディープ インジケーターを構築できます。その結果は、次の図に示すように非常に良好です。 ディープニューラルネットワークは、株式を使用してインデックスを複製するインデックス構築方法として登場しました。 しかし、これはほんの始まりに過ぎません。スマート インデックスを適用し、インデックスの極端な低下を削除して、インデックス マッピング ディープ ニューラル ネットワークをスマート インデックスでトレーニングすると、信じられないほどの速度でインデックスを上回るパフォーマンスが得られます。 この技術は株式ポートフォリオの世界で大きな可能性を秘めています。 結論は 金融業界の現在の傾向は、より複雑で堅牢なモデルに向かっています。多数のデータ サイエンティストが業界に流入しているため、テクノロジーはすべての銀行にとって大きなプレッシャーとなっています。 RelTec や Worldquant などのヘッジファンドはすでにこの技術を取引に利用しています。これらの複雑なモデルが他の分野で示した優れた結果と、金融モデリングにおける大きなギャップにより、イノベーションが劇的に増加するでしょう。 金融と貿易における主要な問題への対応を改善することで、効率性の向上、透明性の向上、リスク管理の強化、新たなイノベーションが生まれます。 |
<<: ある日、お子さんが「お父さん、機械学習って何?」と尋ねたとします。
>>: 素人でもわかるポピュラーサイエンス:これは自然言語処理と呼ばれるものです
[[242467]]現在観察できるマクロ経済、政治、人口、社会、文化、ビジネス、テクノロジーの一般...
翻訳者 | 崔昊レビュー | Chonglouまとめこの記事では、タスクを自ら作成し、優先順位を付け...
小売業界は大きな変革期を迎えています。消費者の購買方法や交流方法が変わり続ける中、小売業者は新たな商...
[51CTO.com からのオリジナル記事] ディープラーニングに代表される人工知能は、画像、音声、...
この 6 部構成のシリーズでは、AI の人類史を探り、革新者、思想家、労働者、さらには小規模なトレー...
1. ロジスティック回帰ロジスティック回帰。まず線形回帰から始めます。線形回帰の出力は実用的な意味を...
[[226531]]人工知能の発展において、人材の確保は間違いなく重要な鍵となります。人工知能は、...
彼はかつてアマゾンの中国トップレベルの科学者であり、1年前に世界の小売業界にセンセーションを巻き起こ...
防疫期間中、マスクの着用は人々の日常の外出に必須の装備となった。マスク着用者の顔認識技術が実際に活用...
機械学習の手法を使用して問題を解決する場合、適切なデータを持つことが重要です。残念ながら、生データは...