最近、香港科技大学、上海AIラボなどの組織が共同で時系列の教師なし事前トレーニングに関する論文を発表しました。従来のTS2Vecなどの時系列表現学習の研究と比較すると、その核心は事前トレーニング段階に空間情報を統合することを提案すること、つまり事前トレーニング段階で各シーケンス間の関係を考慮することです。したがって、本論文で提案された方法は、時空間予測の分野における事前トレーニングモデルとしてもより適していると言えます。以下はこの記事の詳細な紹介です。 論文タイトル: 時空間ブートストラッピングによる相関時系列自己教師表現学習 ダウンロードアドレス: https://arxiv.org/abs/2306.06994 1. 背景過去の研究では、時系列の教師なし事前トレーニングに関する研究が数多く行われており、一般的には時系列エンコーダの自己教師トレーニングに対照学習の考え方が使用されています。しかし、歴史研究には3つの欠点があります。 1 つ目は、これまでのほとんどの手法ではシーケンス全体の表現を学習するのに対し、時系列予測タスクでは各時間ステップの表現に重点が置かれているため、上流タスクと下流タスクの間に一定の非互換性があるということです。 2 つ目は、過去の研究ではすべて、個々のシーケンス間の関係を考慮せずに、単一の時系列自体に対して事前トレーニングを実行していたことです。 3 点目は、従来の対照学習事前トレーニング方法では、負のサンプルを構築する過程で疑似負のサンプル問題 (つまり、構築された負のサンプルは実際には正のサンプルであるべき) に頻繁に遭遇し、モデル効果に悪影響を及ぼしていたことです。 上記 3 つの問題に対して、本論文では一連の解決策を提案しています。その核となるのは、事前学習段階で時間的関係と空間的関係の両方を考慮し、対照学習フレームワークをポジティブサンプルに依存しない BYOL に変更することです。 写真 2. モデルの詳細本論文で提案するモデルの中核構造を下図に示します。その中核は、一方では時空間情報を対照学習に統合する方法であり、他方では対照学習フレームワークのアップグレードです。 時系列の場合、時間次元と空間次元の両方での比較学習が必要であり、時間情報と空間情報は事前トレーニング段階に同時に統合される必要があります。時間ディメンションについては、この論文ではスライディング ウィンドウ アプローチを使用して、シーケンスの 2 つの重複するサブシーケンスを生成します。そのうちの 1 つは時間ディメンションのビューとして使用され、もう 1 つはターゲットとして使用されます。このうち、View 部分はランダム マスクを使用して、いくつかの時間ステップのサンプル ポイントをカバーします。時間次元における対照学習、つまり、ビューと時間ターゲット間の対照学習を使用します。 空間次元では、ノード間の位相関係に従って、現在のシーケンスの隣接シーケンスがランダムにサンプリングされ、スライディング ウィンドウも使用してサブシーケンスが生成されます。このシーケンスは、ビューの空間次元ターゲットとして使用され、対照学習は、ビューと空間ターゲット間の距離を狭めるために使用されます。 本論文では、上記の 2 種類のサンプルを取得した後、BYOL の対照学習フレームワークを採用して負のサンプルの構築を回避し、疑似負のサンプルの問題を解決します。 BYOL は、ポジティブ サンプルのみに依存する対照学習フレームワークです。元の論文の具体的なアプローチは、モデル構造がまったく同じでパラメータが異なる 2 つのオンライン ネットワークとターゲット ネットワークを使用することです。ターゲット ネットワークのパラメータは、オンライン ネットワーク パラメータのスライド平均であり、ターゲット ネットワークの出力は、オンライン ネットワークの予測ターゲットを表します。ターゲット部分は、損失に応じてパラメータを更新しません。つまり、陽性サンプル 1 から陽性サンプル 2 への予測を実現するために、2 セットのパラメータが使用されます。 写真 この論文では、同様のアプローチを使用して、部分的にマスクされたビューを使用して時間ターゲットと空間ターゲットを同時に予測します。モデルの損失には、時間部分と空間部分の対応する比較学習損失が含まれます。モデルの具体的な構造は TCN 構造(本体はホール畳み込み)を採用しており、View と Target のモデルパラメータは共有されません。 3. 実験結果以下は、本稿で提案する表現学習法の時空間予測データセットに対する予測効果です。TS2Vec(現行のSOTA時系列表現学習法)と比較すると、大幅に効果が向上していることがわかります。これは、本論文で提案された空間情報を導入する対照学習が時空間予測問題に対してより効果的であることを示しています。 写真 下の図は予測事例分析を示しています。本論文で提案された手法は、TS2VecUIよりも優れた予測傾向を示しています。 写真 |
<<: Meta AI Zeng Hanqing: サブグラフニューラルネットワークのスケーラブルなアプリケーションと表現力豊かなアプリケーション
マウスを研究するのと同じ方法で AI を研究できるでしょうか?多分。 ICLR 2020 Spotl...
実際、人工知能の概念は 1950 年代にはすでに登場していました。科学者が最初のニューラル ネットワ...
過去数年間、多くのゲーム機はアクセサリを導入することでゲーム体験を向上させることに重点を置いてきまし...
携帯電話でビデオを撮影するときの最大の問題は何ですか?振る……ビデオのジッターは緊急に解決する必要が...
1. ニューラルネットワークを構築してレイヤーを追加する入力値、入力サイズ、出力サイズ、活性化関数ニ...
人工知能 (AI) の登場により、企業の運営方法は劇的に変化し、PR ボットが顧客サービスの革命にお...
Microsoft は最近、顧客がローカル ERP および CRM アプリケーションをクラウドに移行...
人類が歴史から学んだ唯一の教訓は、人類は歴史から何も学べないということだ。 「しかし、機械は学習でき...
Google と他のチームは、遺伝的プログラミングの最新の成果である AutoRobotics-Ze...
[[282830]]視覚的な想像力は人間が生まれながらに持っているものです。AI は同様の能力を持...
ディープラーニング モデルが大きくなるにつれて、あらゆる種類のハイパーパラメータ調整を行うのは非常に...
[オリジナル記事は51CTO.comより] 2018年ロシアワールドカップはエキサイティングな決勝...
自動運転は今とてもホットな話題です。一般の人々も自動車会社も自動運転に強い関心を持っています。現在、...