Pythonアルゴリズムを使用して取引する方法

Pythonアルゴリズムを使用して取引する方法

投資管理会社でシステム開発エンジニアとして働いていたとき、定量金融で成功するには、数学、プログラミング、データ分析に優れている必要があることを学びました。

[[382922]]

アルゴリズム取引または定量取引は、統計的および数学的な取引戦略を設計および開発するプロセスとして定義できます。これは非常に複雑な財務分野です。

では、アルゴリズム取引を始めるにはどうすればよいのでしょうか? この魅力的な取引の世界への道を切り開くために学ぶべき 5 つの重要なトピックを紹介します。私は個人的に、適切なカスタマイズ性、開発の容易さとスピード、テスト フレームワーク、実行速度を提供する Python を好みます。したがって、これらすべてのトピックは、取引のための Python に焦点を当てています。

1. Pythonプログラミングを学ぶ

データサイエンス分野で成功するには、しっかりとした基礎知識が必要です。どの言語を選択する場合でも、その言語で徹底的に理解する必要がある特定のトピックがあります。 Python エコシステムにおけるデータ サイエンスについて知っておくべきことは次のとおりです。

  • 環境設定 - これには、仮想環境の作成、必要なパッケージのインストール、Jupyter Notebook または Google colabs の使用が含まれます。
  • データ構造 — 最も重要な Python データ構造には、リスト、辞書、NumPy 配列、タプル、セットなどがあります。皆さんの学習に役立つように、リンク先の記事にいくつかの例を集めました。
  • オブジェクト指向プログラミング - クオンツとしては、適切なクラスが定義された、構造化されたコードを記述する能力が優れていることを確認する必要があります。 Pandas、NumPy、SciPy などの外部パッケージを使用する場合は、オブジェクトとそのメソッドの使用方法を学習する必要があります。

2. 財務データの処理方法を理解する

データ分析は財務の重要な部分です。 Pandas を使用してデータ フレームを操作する方法を学ぶことに加えて、取引データを操作する際に知っておくべき特定のトピックがいくつかあります。

Pandasを使用してデータを探索する方法

Pandas は、間違いなく Python データ サイエンス スタックの中で最も重要なパッケージの 1 つです。パッケージで定義された関数を使用して、ほぼすべての主要なタスクを実行できます。データフレームの作成、フィルタリング (loc、iloc、クエリ)、記述統計 (概要)、結合/マージ、グループ化、サブセット化に重点を置きます。

時系列データの処理方法

トランザクションデータは時系列分析がすべてです。データ頻度を分単位から時間単位に、または 1 日の OHLC データから週末データに変更するには、データを再サンプリングするか、データを再インデックスする方法を学習する必要があります。たとえば、resample 関数を使用して、1 分間の時系列を 3 分間の時系列データに変換できます。

  1. df_3min = df_1min.resample( '3Min' , label= 'left' ).agg({ 'OPEN' : 'first' , 'HIGH' : 'max' , 'LOW' : 'min' , 'CLOSE' : 'last' })

3. 基本的な取引アルゴリズムの書き方

定量金融分野でのキャリアには、統計的仮説検定と数学に対する深い理解が必要です。多変量計算、線形代数、確率論などの概念を習得すると、アルゴリズムの設計と記述のための優れた基盤を構築するのに役立ちます。まず、株価データの移動平均を計算し、簡単なアルゴリズム戦略 (移動平均クロスオーバーや平均回帰戦略など) を記述し、相対力取引について学ぶことができます。基本的な統計アルゴリズムの仕組みを理解するという小さいながらも重要な一歩を踏み出して練習した後は、機械学習技術のより複雑な領域を深く掘り下げることができます。これらには、統計と数学のより深い理解が必要です。最初に読むべき 2 冊の本: アーネスト チャン博士著「Quantitative Trading: How to Build Your Own Algorithmic Trading Business」、バリー ジョンソン著「Book on Algorithmic Trading and DMA」

4. バックテストを理解する

取引戦略をコーディングしたら、実際のお金を使ってライブ市場でテストするだけではだめですよね?次のステップは、その戦略を過去の取引データのストリームに公開して、取引シグナルを生成することです。実行された取引には関連する損益 (P&L) があり、すべての取引を累積すると合計 P&L が得られます。これをバックテストと呼びます。バックテストには、数学、統計、ソフトウェア エンジニアリング、市場の微細構造など、多くの分野に精通している必要があります。バックテストを適切に理解するために学ぶべき概念をいくつか紹介します。

  • まずテクニカル指標を理解することから始めましょう。これらのインジケーターを使用するには、TA_Lib という Python パッケージを調べてください。
  • パラボリック SAR などのモメンタム指標を使用して、取引コストとスリッページを計算してみましょう。
  • 戦略の累積収益をプロットし、戦略の全体的なパフォーマンスを研究する方法を学びます。
  • バックテストのパフォーマンスに影響を与える非常に重要な概念はバイアスです。最適化バイアス、先読みバイアス、心理的寛容性、生存バイアスに注意する必要があります。

5. パフォーマンス指標 - 取引戦略を評価する方法

自分の戦略を簡潔に説明できることが重要です。自分の戦略を理解していない場合、外部の規制の変更や体制の変化によって、戦略が不安定な動作をし始める可能性があります。戦略を自信を持って理解したら、次のパフォーマンス メトリックを使用して、戦略の実際の長所と短所を理解することができます。

  • シャープレシオ - 戦略のリスク/報酬比率を経験的に説明します。これは、株式カーブが経験するボラティリティのレベルから期待できる利益を定量化します。
  • ボラティリティ - 戦略に関連する「リスク」を定量化します。シャープ比もこの特性を反映しています。一般的に、原資産のボラティリティが高くなると、株式カーブのリスクが高まり、シャープ比率は低下します。
  • 最大ドローダウン - 戦略のエクイティ カーブにおける、ピークから谷までの全体的な最大の下落率 (パーセンテージ)。最大ドローダウンはこれによって影響を受けるため、通常はモメンタム戦略と組み合わせて研究されます。計算に NumPy ライブラリを使用する方法を学びます。
  • 容量/流動性 - 資本を増やす戦略のスケーラビリティを決定します。多くのファンドや投資管理会社は、戦略によって資本配分が増加するにつれて、こうしたキャパシティの問題に悩まされています。
  • CAGR – 一定期間にわたる戦略の平均成長率を測定します。計算式は、(累積戦略リターン)^(252 / 取引日数)— 1です。

<<:  米国は人工知能戦争への準備を強化している

>>:  機械学習モデルを評価する際にデータ漏洩を防ぐ方法

ブログ    
ブログ    

推薦する

生画像の新しい「マルチモーダル」AIテキストレンダリングはMidjourney + DALL·E 3に勝る!Karpathyが5億元の資金調達に投資

「10人のチームを持ち、年間売上高が1億ドルを超えるスタートアップ」を輩出する道として、文芸グラフィ...

2022年の人工知能の7つのトレンド

近い将来に大きな価値を生み出す可能性のある技術の予測となると、人工知能は間違いなくリストのトップに位...

...

新しい検索エンジンのスキル: アリババの新しい研究では、2D 画像を使用して 3D モデルを検索します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

Quark App、健康検索をアップグレードし、健康モデルアプリ「Quark Health Assistant」をリリース

12月25日、Quark Appは健康検索の全面的なアップグレードを発表し、健康大規模モデルアプリケ...

AI顧客サービス指標について話す

インテリジェントな顧客サービスの評価基準は何かというビジネス上の問い合わせを頻繁に受けます。これは答...

ディープラーニングで知っておくべき活性化関数トップ10

みなさんこんにちは、ピーターです〜最近、reddit で非常に鮮明な mó xìng の写真を見まし...

2021年の中国の医療人工知能産業の展望

医療用人工知能製品は多様化しており、下流の需要は強い医療人工知能産業の上流は、主に医療データマイニン...

DALL・Eは発売からわずか2日で復刻されたのか?公式論文はまだ発表されていないが、専門家らはすでにそれを再現している。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

5つの異なるタイプの人工知能

近年、人工知能は、データから洞察を引き出すことに関する企業の考え方を一変させました。ほとんどの人はこ...

...

...

物体検出と注釈の時代は終わったのでしょうか?

急速に進化する機械学習の分野では、データのラベル付けという面倒で時間のかかる作業が依然として存在して...