時間畳み込みネットワーク: 時系列の次の革命?

時間畳み込みネットワーク: 時系列の次の革命?

この投稿では、最近の TCN ベースのソリューションをいくつかレビューします。

まず、動き検出のケーススタディを紹介し、TCN アーキテクチャと、畳み込みニューラル ネットワーク (CNN) や再帰型ニューラル ネットワーク (RNN) などの従来の方法と比較したその利点について簡単に説明します。次に、改善された交通予測、サウンドイベントの位置特定と検出、確率予測など、TCN のいくつかの新しいアプリケーションが紹介されます。

TCNの簡単なレビュー

Lea らによる先駆的な研究(2016) は、ビデオベースのアクションセグメンテーションのための時間畳み込みネットワーク (TCN) を初めて提案しました。この一般的なプロセスの 2 つのステップでは、まず、時空間情報をエンコードする (通常は) CNN を使用して低レベルの特徴を計算し、次に、これらの低レベルの特徴を、(通常は RNN を使用して) 高レベルの時間情報を取得する分類器に入力します。このアプローチの主な欠点は、2 つの別個のモデルが必要になることです。 TCN は、2 つの情報レベルすべてを階層的にキャプチャするための統一されたアプローチを提供します。

エンコーダー/デコーダー フレームワークを図 1 に示します。アーキテクチャの詳細については、最初の 2 つの参考文献 (記事の最後にあります) を参照してください。最も重要な問題は、TCN が任意の長さのシーケンスを受け取り、それを同じ長さで出力できることです。 1D 完全畳み込みネットワーク アーキテクチャを使用する場合は、因果畳み込みが使用されます。重要な特徴は、時刻 t の出力が t より前に発生した要素のみと畳み込まれることです。

Yan らによる最近の研究成果の発表により、TCN をめぐる話題は Nature 誌にも掲載されました。 (2020) TCNの天気予報タスク。彼らの研究では、TCN と LSTM を使用した比較実験が行われました。彼らの結果の 1 つは、他の方法の中でも、TCN が時系列データを使用した予測タスクで優れたパフォーマンスを発揮したというものでした。

次のセクションでは、この古典的な TCN の実装と拡張について説明します。

交通予測の改善

ライドシェアリングやオンラインナビゲーションサービスは、交通予測を改善し、人々の移動方法を変えることができます。交通予測の精度が向上すると、交通渋滞の減少、汚染の低減、運転の安全性と速度の向上などにつながります。これはリアルタイムのデータ駆動型の問題であるため、今後の交通の蓄積されたデータを活用する必要があります。これに基づいて、Dai et al. (2020) は最近、ハイブリッド時空間グラフ畳み込みネットワーク (H-STGCN) を提案しました。基本的な考え方は、セグメント化されたライニングの流量と密度の関係を利用し、対向車の交通量を同等の移動時間に変換することです。この研究で使用された最も興味深い方法の 1 つは、空間依存性を捉えるグラフ畳み込みです。複合隣接行列は、フロー近似の固有の特性を捉えます (詳細については、Li、2017 を参照してください)。次のアーキテクチャでは、予測プロセス全体を記述するために 4 つのモジュールが提案されています。

ダイら(2020)

音響イベントの位置特定と検出

音響イベントの位置特定と検出 (SELD) の分野は継続的に成長しています。環境の理解は自律航行において重要な役割を果たします。 Guirguisら(2020)は最近、サウンドイベントSELD-TCNの新しいアーキテクチャを提案しました。彼らは、彼らのフレームワークが現場トレーニングにおける現在の最先端技術よりも優れていると主張しています。 SELDnet (構造は下記) では、44.1 kHz でサンプリングされたマルチチャンネルのオーディオ録音に短時間フーリエ変換を適用してスペクトルの位相と振幅を抽出し、個別の入力機能としてスタックします。次に、畳み込みブロックと再帰ブロック (双方向 GRU) が接続され、その後に完全接続ブロックが続きます。 SELDnet の出力は、サウンド イベント検出 (SED) と到着方向 (DOA) です。

ギルギスら(2020)

それを上回るために、彼らはSELD-TCNを提案しました。

ギルギスら(2020)

拡張畳み込みにより、ネットワークはさまざまな入力を処理できるようになるため、より深いネットワークが必要になる場合があります (ネットワークはバックプロパゲーション中に不安定な勾配の影響を受けます)。彼らは、WaveNet (Dario et al., 2017) アーキテクチャを採用することでこの課題を克服しました。彼らは、SELD タスクには再帰層は必要なく、アクティブなサウンド イベントの開始時間と終了時間を正常に検出できることを示しました。

確率予測

Chen et al. (2020) によって設計された新しいフレームワークを使用して、確率密度を推定できます。時系列予測は、多くのビジネス上の意思決定シナリオ (リソース管理など) を改善します。確率予測は、履歴データから情報を抽出し、将来の出来事に関する不確実性を最小限に抑えることができます。予測タスクが数百万の関連データ シリーズを予測することである場合 (小売業など)、パラメーター推定に多大な労力とコンピューティング リソースが必要になります。これらの困難に対処するために、彼らは CNN ベースの密度推定および予測フレームワークを提案しました。彼らのフレームワークは、系列間の潜在的な相関関係を学習することができます。彼らの研究の斬新さは、彼らのアーキテクチャに示されているように、彼らが提案したディープ TCN にあります。

チェンら(2020)

エンコーダー/デコーダー モジュール ソリューションは、実用的な大規模アプリケーションの設計に役立つ可能性があります。

<<:  GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

>>:  絶賛されていたGPT-3が充電開始します!ネットユーザー:値段が高す​​ぎる。もう行っちゃった。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2019 年の機械学習フレームワークの戦い: Tensorflow との競争は熾烈、進化する PyTorch はどこで勝利するのか?

[[278853]]ビッグデータダイジェスト制作出典: thegradient翻訳者: 張大毓如、...

表形式データでの機械学習に特徴抽出を使用する方法

データ準備の最も一般的なアプローチは、データセットを調査し、機械学習アルゴリズムの期待値を確認し、最...

...

...

Transformerのランクを下げ、LLMのパフォーマンスを低下させることなく、特定のレイヤーのコンポーネントの90%以上を削除する

大規模モデルの時代において、Transformer は科学研究分野全体を一手にサポートします。 Tr...

彼の人工知能ツールは生きた細胞の内部を覗くことができる

[[272732]] ▲ 図:アレン細胞科学研究所のコンピュータービジョン研究者、グレッグ・ジョンソ...

コンテストを利用して学習を促進し、エコシステムを共同で構築し、人工知能を普及させましょう。

[元記事は51CTO.comより] 2021年7月12日、上海紫竹コートヤードホテルで、神府改革革...

...

...

2024 年の 6 つの主要なテクノロジー トレンドを見据えて、最もホットなテクノロジーをご紹介します。

物事の誕生は突然かつ急速です。変化せずに動くものはなく、移行せずに動くものもありません。技術革新のス...

中国移動のチーフサイエンティスト、馮俊蘭氏との独占インタビュー:AIビジネスアプリケーションは何度も融合する必要がある

「インテリジェンス」が本格的に到来!人工知能(AI)は、科学技術革命と産業変革の新たなラウンドにおけ...

PaaS でフェイルオーバー アルゴリズムを作成する際に避けるべき 3 つの落とし穴

[[125412]]クラウド サービスの停止が発生すると、通常はフェイルオーバー メカニズムがアクテ...

...

いつ表面的に調べ、いつ深く掘り下げるべきか - 機械学習は1ページで説明できるものではありません

機械学習、ディープラーニング、人工知能の台頭は議論の余地のない事実となり、コンピュータサイエンスの分...