金融分野で一般的に使用されているディープラーニングモデルのインベントリ

金融分野で一般的に使用されているディープラーニングモデルのインベントリ

[[208429]]

本日公開したこの記事では、著者の Sonam Srivastava が金融分野におけるディープラーニングの 3 つの使用例と、これらのモデルの長所と短所の証拠について説明しています。

私たちは Sonam Srivastava 氏の分析に従い、金融分野におけるディープラーニングの応用の展望に期待しています。金融は最も計算集約的な分野ですが、広く使用されている金融モデル(教師ありモデル、教師なしモデル、状態ベースモデル、計量経済モデル、さらには確率モデル)はすべて、過剰適合やヒューリスティックな問題に悩まされており、サンプリング結果が不十分です。金融エコシステムは非常に複雑であるため、その非線形性には相互作用する多数の要因が満ちています。

これに対処するために、画像認識、音声認識、感情分析におけるディープラーニングに関する研究を検討すると、これらのモデルは大規模なラベルなしデータから学習し、過剰適合を避けるために簡単に調整できる非線形関係の再帰構造を形成できることがわかります。

金融エコシステムがこれらのネットワークをモデリングに使用できれば、その応用分野は広範囲に及ぶでしょう。これらのモデルは、価格設定、ポートフォリオ構築、リスク管理、さらには高頻度取引などの分野で使用できます。これらの問題に取り組みましょう。

収益予測

毎日の金価格を予測するサンプリング問題を例に、まず従来のアプローチを見てみましょう。

ARIMAモデル

ARIMA モデル (自己回帰積分移動平均モデル) は、微分積分移動平均自己回帰モデル、積分移動平均自己回帰モデル (移動はスライディングとも呼ばれる) とも呼ばれ、時系列予測および分析方法の 1 つです。 ARIMA (p, d, q) では、AR は「自己回帰」を表し、p は自己回帰項の数です。MA は「移動平均」を表し、q は移動平均項の数、d は定常系列にするために行われた差 (順序) の数です。 ARIMA の英語名には「差異」という言葉は出てきませんが、これは重要なステップです。

ARIMA モデルの基本的な考え方は、予測対象が時間の経過とともに形成するデータ シーケンスをランダム シーケンスと見なし、特定の数学モデルを使用してこのシーケンスを近似することです。このモデルが特定されると、時系列の過去と現在の値から将来の値を予測できるようになります。現代の統計手法と計量経済モデルは、企業が将来を予測するのにある程度役立っています。統合移動平均自己回帰モデルを使用して季節定常時系列を予測すると、次の図に示す結果が得られます。

VARモデル

VAR モデル (ベクトル自己回帰モデル) ベクトル自己回帰モデルは、計量経済学者でマクロ経済学者の Christopher Sims によって提案された、一般的に使用されている計量経済モデルです。これは、1 つの変数しか使用できない自己回帰モデル (略して AR モデル) を複数の変数に対応できるように拡張したもので、多変量​​時系列モデルの解析でよく使用されます。

相関予測変数を自己回帰モデルに追加し、ベクトル自己回帰モデルに移行すると、次の図に示す結果が得られます。

深層回帰モデル

同じ入力でデータに単純な深層回帰モデルを使用すると、次の図に示すように、はるかに優れた結果が得られます。

畳み込みニューラルネットワーク

畳み込みニューラル ネットワーク (CNN) は、人工ニューロンが特定のカバレッジ領域内の周囲のユニットに応答でき、大規模な画像処理で優れたパフォーマンスを発揮するフィードフォワード ニューラル ネットワークです。

畳み込みニューラル ネットワークは、1 つ以上の畳み込み層と最上部の完全接続層 (従来のニューラル ネットワークに対応)、および関連する重みとプーリング層で構成されます。この構造により、畳み込みニューラル ネットワークは入力データの 2 次元構造を活用できるようになります。他のディープラーニング構造と比較して、畳み込みニューラル ネットワークは画像認識と音声認識においてより優れた結果をもたらすことができます。このモデルは、バックプロパゲーション アルゴリズムを使用してトレーニングすることもできます。他のディープ フィードフォワード ニューラル ネットワークと比較すると、畳み込みニューラル ネットワークは考慮すべきパラメーターが少ないため、魅力的なディープラーニング構造となっています。

アーキテクチャを変更し、畳み込みニューラル ネットワークを使用して同じ問題を解決すると、結果は次のようになります。

得られた結果は大幅に改善されました。しかし、最悪の事態はまだ来ていない。

長期短期記憶ネットワーク

Long Short-Term Memory (LSTM) は時間再帰ニューラル ネットワーク (RNN) であり、その論文は 1997 年に初めて発表されました。 LSTM は、その独自の設計構造により、非常に長い間隔と遅延を持つ時系列内の重要なイベントの処理と予測に適しています。

LSTM は、多くの場合、非セグメント化連続手書き認識などにおいて、時間再帰ニューラル ネットワークや隠れマルコフ モデル (HMM) よりも優れたパフォーマンスを発揮します。 2009 年、LSTM で構築された人工ニューラル ネットワーク モデルが ICDAR 手書き認識コンテストで優勝しました。 LSTM は自律音声認識にも広く使用されており、2013 年には TIMIT 自然音声データベースを使用して 17.7% という記録的なエラー率を達成しました。非線形モデルとして、LSTM は、より大規模なディープ ニューラル ネットワークを構築するための複雑な非線形ユニットとして使用できます。

リカレント ニューラル ネットワーク (RNN) のバリエーションを使用して、次の結果が得られました。

したがって、平均二乗誤差の傾向は全体的に予想外です。

ポートフォリオ構築

私たちがディープラーニングを使って解決しようとしている 2 番目の金融問題は、ポートフォリオの構築です。この問題にはディープラーニングの実用的応用が非常に有効です。私の研究は、この論文「Deep Portfolio」(https://0x9.me/8uOBt)に触発されました。

この論文の著者は、時系列をそれ自体にマッピングするオートエンコーダーの構築を試みています。これらのオートエンコーダを使用した予測誤差は、株式のベータ(市場と相関)の代理となり、オートエンコーダは市場のモデルとして機能します。

オートエンコーダは、主にデータの次元削減や特徴抽出に使用される教師なし学習アルゴリズムです。ディープラーニングでは、オートエンコーダを使用して、トレーニングフェーズが始まる前に重み行列 W の初期値を決定できます。上記のオートエンコーダーのエラーに基づいて異なる株を選択し、別のディープ ニューラル ネットワークを使用してディープ インジケーターを構築できます。その結果は、次の図に示すように非常に良好です。

ディープニューラルネットワークは、株式を使用してインデックスを複製するインデックス構築方法として登場しました。

しかし、これはほんの始まりに過ぎません。スマート インデックスを適用し、インデックスの極端な低下を削除して、インデックス マッピング ディープ ニューラル ネットワークをスマート インデックスでトレーニングすると、信じられないほどの速度でインデックスを上回るパフォーマンスが得られます。

この技術は株式ポートフォリオの世界で大きな可能性を秘めています。

結論は

金融業界の現在の傾向は、より複雑で堅牢なモデルに向かっています。多数のデータ サイエンティストが業界に流入しているため、テクノロジーはすべての銀行にとって大きなプレッシャーとなっています。 RelTec や Worldquant などのヘッジファンドはすでにこの技術を取引に利用しています。これらの複雑なモデルが他の分野で示した優れた結果と、金融モデリングにおける大きなギャップにより、イノベーションが劇的に増加するでしょう。

金融と貿易における主要な問題への対応を改善することで、効率性の向上、透明性の向上、リスク管理の強化、新たなイノベーションが生まれます。

<<:  ある日、お子さんが「お父さん、機械学習って何?」と尋ねたとします。

>>:  素人でもわかるポピュラーサイエンス:これは自然言語処理と呼ばれるものです

ブログ    
ブログ    

推薦する

注目の開発スキル5つについて学ぶ

[[277303]] [51CTO.com クイック翻訳] 開発者は人気のある仕事の 1 つであり、...

LLaMA 2 エンドツーエンド推論が利用可能になりました。中国チームより

Buddy CompilerのエンドツーエンドLLaMA2-7B推論例がbuddy-mlirリポジト...

2021年にはAI機能を導入する企業がますます増える

[[360047]]今年、ほとんどの企業は、新型コロナウイルス感染症による混乱に対処し、リモートワー...

0.5秒、GPU不要、安定性AIと中国チームVASTオープンソース単一画像生成3DモデルTripoSR

最近、ヴィンセントのビデオモデル「Sora」が生成 AI モデルの新たな波を引き起こし、そのモデルの...

AI時代の企業の変革とイノベーション

人工知能は、私たちの生活、仕事、学習に影響を与えるだけでなく、企業の運営、戦略、組織にも影響を与える...

アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

機械学習の進歩がモデルによってもたらされるのか、それともデータによってもたらされるのかは、今世紀の論...

F#の並列ソートアルゴリズムは実装が簡単

F# の並列ソート アルゴリズムで最も一般的な方法の 1 つは、まず処理するデータを複数の部分に分割...

自動運転のための多視点視覚認識の理解

出力次元の観点から、視覚センサーに基づく知覚方法は、2D知覚と3D知覚に分けられます。視覚システムは...

...

インドのチームが人間のように考えることができる自動運転アルゴリズムを開発

[51CTO.com クイック翻訳]インド工科大学 (IIT マドラス) の研究者らは、人間のように...

大学は人工知能人材育成に力を入れており、「ロボット工学」専攻が人気に

[[225297]]毎年恒例の「大学入試シーズン」が到来し、受験生や保護者にとって、受験願書の記入は...

AI時代が近づいています。将来的には人工知能を活用した教育方法も登場するのでしょうか?

人工知能技術の進歩により、あらゆる生活がこの技術によって変化し始めています。近い将来、人工知能技術の...

...

...

人工知能の主要技術分野のレビュー

[[441598]] AI への準備プロセスの多くは組織の変更です。人工知能の利用には、ニューカラー...