最近、香港科技大学、上海AIラボなどの組織が共同で時系列の教師なし事前トレーニングに関する論文を発表しました。従来のTS2Vecなどの時系列表現学習の研究と比較すると、その核心は事前トレーニング段階に空間情報を統合することを提案すること、つまり事前トレーニング段階で各シーケンス間の関係を考慮することです。したがって、本論文で提案された方法は、時空間予測の分野における事前トレーニングモデルとしてもより適していると言えます。以下はこの記事の詳細な紹介です。 論文タイトル: 時空間ブートストラッピングによる相関時系列自己教師表現学習 ダウンロードアドレス: https://arxiv.org/abs/2306.06994 1. 背景過去の研究では、時系列の教師なし事前トレーニングに関する研究が数多く行われており、一般的には時系列エンコーダの自己教師トレーニングに対照学習の考え方が使用されています。しかし、歴史研究には3つの欠点があります。 1 つ目は、これまでのほとんどの手法ではシーケンス全体の表現を学習するのに対し、時系列予測タスクでは各時間ステップの表現に重点が置かれているため、上流タスクと下流タスクの間に一定の非互換性があるということです。 2 つ目は、過去の研究ではすべて、個々のシーケンス間の関係を考慮せずに、単一の時系列自体に対して事前トレーニングを実行していたことです。 3 点目は、従来の対照学習事前トレーニング方法では、負のサンプルを構築する過程で疑似負のサンプル問題 (つまり、構築された負のサンプルは実際には正のサンプルであるべき) に頻繁に遭遇し、モデル効果に悪影響を及ぼしていたことです。 上記 3 つの問題に対して、本論文では一連の解決策を提案しています。その核となるのは、事前学習段階で時間的関係と空間的関係の両方を考慮し、対照学習フレームワークをポジティブサンプルに依存しない BYOL に変更することです。 写真 2. モデルの詳細本論文で提案するモデルの中核構造を下図に示します。その中核は、一方では時空間情報を対照学習に統合する方法であり、他方では対照学習フレームワークのアップグレードです。 時系列の場合、時間次元と空間次元の両方での比較学習が必要であり、時間情報と空間情報は事前トレーニング段階に同時に統合される必要があります。時間ディメンションについては、この論文ではスライディング ウィンドウ アプローチを使用して、シーケンスの 2 つの重複するサブシーケンスを生成します。そのうちの 1 つは時間ディメンションのビューとして使用され、もう 1 つはターゲットとして使用されます。このうち、View 部分はランダム マスクを使用して、いくつかの時間ステップのサンプル ポイントをカバーします。時間次元における対照学習、つまり、ビューと時間ターゲット間の対照学習を使用します。 空間次元では、ノード間の位相関係に従って、現在のシーケンスの隣接シーケンスがランダムにサンプリングされ、スライディング ウィンドウも使用してサブシーケンスが生成されます。このシーケンスは、ビューの空間次元ターゲットとして使用され、対照学習は、ビューと空間ターゲット間の距離を狭めるために使用されます。 本論文では、上記の 2 種類のサンプルを取得した後、BYOL の対照学習フレームワークを採用して負のサンプルの構築を回避し、疑似負のサンプルの問題を解決します。 BYOL は、ポジティブ サンプルのみに依存する対照学習フレームワークです。元の論文の具体的なアプローチは、モデル構造がまったく同じでパラメータが異なる 2 つのオンライン ネットワークとターゲット ネットワークを使用することです。ターゲット ネットワークのパラメータは、オンライン ネットワーク パラメータのスライド平均であり、ターゲット ネットワークの出力は、オンライン ネットワークの予測ターゲットを表します。ターゲット部分は、損失に応じてパラメータを更新しません。つまり、陽性サンプル 1 から陽性サンプル 2 への予測を実現するために、2 セットのパラメータが使用されます。 写真 この論文では、同様のアプローチを使用して、部分的にマスクされたビューを使用して時間ターゲットと空間ターゲットを同時に予測します。モデルの損失には、時間部分と空間部分の対応する比較学習損失が含まれます。モデルの具体的な構造は TCN 構造(本体はホール畳み込み)を採用しており、View と Target のモデルパラメータは共有されません。 3. 実験結果以下は、本稿で提案する表現学習法の時空間予測データセットに対する予測効果です。TS2Vec(現行のSOTA時系列表現学習法)と比較すると、大幅に効果が向上していることがわかります。これは、本論文で提案された空間情報を導入する対照学習が時空間予測問題に対してより効果的であることを示しています。 写真 下の図は予測事例分析を示しています。本論文で提案された手法は、TS2VecUIよりも優れた予測傾向を示しています。 写真 |
<<: Meta AI Zeng Hanqing: サブグラフニューラルネットワークのスケーラブルなアプリケーションと表現力豊かなアプリケーション
物理的な世界を中心としたこれまでの産業革命とは異なり、第 4 次産業革命によって導入されたデジタル要...
人工知能は、機械を通じて人間の思考と意思決定をシミュレートすることに重点を置いたコンピューターサイエ...
TSMCの生産能力不足により、Nvidiaはチップ製造をIntelに頼らざるを得なくなったのか? T...
[[252634]]データ サイエンティストは機械学習モデルを作成した後、それを本番環境にデプロイす...
業界の専門家によると、人工知能を使用していない多くの企業がこの新興技術を急いで導入し始めている一方で...
【51CTO.com クイック翻訳】過去 10 年間、製造業者は継続的に利益を向上させるために自動化...
人間とは異なり、人工ニューラル ネットワークは新しいことを学習するときに以前に学習した情報をすぐに忘...
AIが描く人物をよりリアルにするため、香港中文大学の博士課程の学生たちは3億4000万枚の画像を使っ...
4G と 5G の世界的な展開は商用サービスの進歩よりも速く、6G は 2030 年までに登場する...
テクノロジーについて何も知らない人の目には、人工知能とは何でしょうか?これが『流転地球』に出てくるA...
[[264788]]プログラマーが Python コードを書くという反復的な作業を軽減するのに役立...
有名なフランス人プログラマー、ファブリス・ベラール氏は最近、普通のデスクトップコンピュータ(2,00...
高速かつ経済的なソートアルゴリズムスペースを無駄にせず、より高速なソートアルゴリズムはありますか?そ...