金融分野で一般的に使用されているディープラーニングモデルのインベントリ

[[208429]]

本日公開したこの記事では、著者の Sonam Srivastava が金融分野におけるディープラーニングの 3 つの使用例と、これらのモデルの長所と短所の証拠について説明しています。

私たちは Sonam Srivastava 氏の分析に従い、金融分野におけるディープラーニングの応用の展望に期待しています。金融は最も計算集約的な分野ですが、広く使用されている金融モデル（教師ありモデル、教師なしモデル、状態ベースモデル、計量経済モデル、さらには確率モデル）はすべて、過剰適合やヒューリスティックな問題に悩まされており、サンプリング結果が不十分です。金融エコシステムは非常に複雑であるため、その非線形性には相互作用する多数の要因が満ちています。

これに対処するために、画像認識、音声認識、感情分析におけるディープラーニングに関する研究を検討すると、これらのモデルは大規模なラベルなしデータから学習し、過剰適合を避けるために簡単に調整できる非線形関係の再帰構造を形成できることがわかります。

金融エコシステムがこれらのネットワークをモデリングに使用できれば、その応用分野は広範囲に及ぶでしょう。これらのモデルは、価格設定、ポートフォリオ構築、リスク管理、さらには高頻度取引などの分野で使用できます。これらの問題に取り組みましょう。

収益予測

毎日の金価格を予測するサンプリング問題を例に、まず従来のアプローチを見てみましょう。

ARIMAモデル

ARIMA モデル (自己回帰積分移動平均モデル) は、微分積分移動平均自己回帰モデル、積分移動平均自己回帰モデル (移動はスライディングとも呼ばれる) とも呼ばれ、時系列予測および分析方法の 1 つです。 ARIMA (p, d, q) では、AR は「自己回帰」を表し、p は自己回帰項の数です。MA は「移動平均」を表し、q は移動平均項の数、d は定常系列にするために行われた差 (順序) の数です。 ARIMA の英語名には「差異」という言葉は出てきませんが、これは重要なステップです。

ARIMA モデルの基本的な考え方は、予測対象が時間の経過とともに形成するデータシーケンスをランダムシーケンスと見なし、特定の数学モデルを使用してこのシーケンスを近似することです。このモデルが特定されると、時系列の過去と現在の値から将来の値を予測できるようになります。現代の統計手法と計量経済モデルは、企業が将来を予測するのにある程度役立っています。統合移動平均自己回帰モデルを使用して季節定常時系列を予測すると、次の図に示す結果が得られます。

VARモデル

VAR モデル (ベクトル自己回帰モデル) ベクトル自己回帰モデルは、計量経済学者でマクロ経済学者の Christopher Sims によって提案された、一般的に使用されている計量経済モデルです。これは、1 つの変数しか使用できない自己回帰モデル (略して AR モデル) を複数の変数に対応できるように拡張したもので、多変量時系列モデルの解析でよく使用されます。

相関予測変数を自己回帰モデルに追加し、ベクトル自己回帰モデルに移行すると、次の図に示す結果が得られます。

深層回帰モデル

同じ入力でデータに単純な深層回帰モデルを使用すると、次の図に示すように、はるかに優れた結果が得られます。

畳み込みニューラルネットワーク

畳み込みニューラルネットワーク (CNN) は、人工ニューロンが特定のカバレッジ領域内の周囲のユニットに応答でき、大規模な画像処理で優れたパフォーマンスを発揮するフィードフォワードニューラルネットワークです。

畳み込みニューラルネットワークは、1 つ以上の畳み込み層と最上部の完全接続層 (従来のニューラルネットワークに対応)、および関連する重みとプーリング層で構成されます。この構造により、畳み込みニューラルネットワークは入力データの 2 次元構造を活用できるようになります。他のディープラーニング構造と比較して、畳み込みニューラルネットワークは画像認識と音声認識においてより優れた結果をもたらすことができます。このモデルは、バックプロパゲーションアルゴリズムを使用してトレーニングすることもできます。他のディープフィードフォワードニューラルネットワークと比較すると、畳み込みニューラルネットワークは考慮すべきパラメーターが少ないため、魅力的なディープラーニング構造となっています。

アーキテクチャを変更し、畳み込みニューラルネットワークを使用して同じ問題を解決すると、結果は次のようになります。

得られた結果は大幅に改善されました。しかし、最悪の事態はまだ来ていない。

長期短期記憶ネットワーク

Long Short-Term Memory (LSTM) は時間再帰ニューラルネットワーク (RNN) であり、その論文は 1997 年に初めて発表されました。 LSTM は、その独自の設計構造により、非常に長い間隔と遅延を持つ時系列内の重要なイベントの処理と予測に適しています。

LSTM は、多くの場合、非セグメント化連続手書き認識などにおいて、時間再帰ニューラルネットワークや隠れマルコフモデル (HMM) よりも優れたパフォーマンスを発揮します。 2009 年、LSTM で構築された人工ニューラルネットワークモデルが ICDAR 手書き認識コンテストで優勝しました。 LSTM は自律音声認識にも広く使用されており、2013 年には TIMIT 自然音声データベースを使用して 17.7% という記録的なエラー率を達成しました。非線形モデルとして、LSTM は、より大規模なディープニューラルネットワークを構築するための複雑な非線形ユニットとして使用できます。

リカレントニューラルネットワーク (RNN) のバリエーションを使用して、次の結果が得られました。

したがって、平均二乗誤差の傾向は全体的に予想外です。

ポートフォリオ構築

私たちがディープラーニングを使って解決しようとしている 2 番目の金融問題は、ポートフォリオの構築です。この問題にはディープラーニングの実用的応用が非常に有効です。私の研究は、この論文「Deep Portfolio」（https://0x9.me/8uOBt）に触発されました。

この論文の著者は、時系列をそれ自体にマッピングするオートエンコーダーの構築を試みています。これらのオートエンコーダを使用した予測誤差は、株式のベータ（市場と相関）の代理となり、オートエンコーダは市場のモデルとして機能します。

オートエンコーダは、主にデータの次元削減や特徴抽出に使用される教師なし学習アルゴリズムです。ディープラーニングでは、オートエンコーダを使用して、トレーニングフェーズが始まる前に重み行列 W の初期値を決定できます。上記のオートエンコーダーのエラーに基づいて異なる株を選択し、別のディープニューラルネットワークを使用してディープインジケーターを構築できます。その結果は、次の図に示すように非常に良好です。

ディープニューラルネットワークは、株式を使用してインデックスを複製するインデックス構築方法として登場しました。

しかし、これはほんの始まりに過ぎません。スマートインデックスを適用し、インデックスの極端な低下を削除して、インデックスマッピングディープニューラルネットワークをスマートインデックスでトレーニングすると、信じられないほどの速度でインデックスを上回るパフォーマンスが得られます。

この技術は株式ポートフォリオの世界で大きな可能性を秘めています。

結論は

金融業界の現在の傾向は、より複雑で堅牢なモデルに向かっています。多数のデータサイエンティストが業界に流入しているため、テクノロジーはすべての銀行にとって大きなプレッシャーとなっています。 RelTec や Worldquant などのヘッジファンドはすでにこの技術を取引に利用しています。これらの複雑なモデルが他の分野で示した優れた結果と、金融モデリングにおける大きなギャップにより、イノベーションが劇的に増加するでしょう。

金融と貿易における主要な問題への対応を改善することで、効率性の向上、透明性の向上、リスク管理の強化、新たなイノベーションが生まれます。

<<: ある日、お子さんが「お父さん、機械学習って何？」と尋ねたとします。

>>: 素人でもわかるポピュラーサイエンス：これは自然言語処理と呼ばれるものです