機械学習を使って株価を予測する非常に簡単な方法

[[336572]]

この記事では、H2o.ai フレームワークを使用した機械学習を使用して R 言語で株価を予測する手順を段階的に説明しました。このフレームワークは Python でも使用できますが、私は R に慣れているため、このチュートリアルでは R 言語を使用します。「人工知能を使って株価を予測するにはどうしたらいいのだろう？」と疑問に思ったことがあるかもしれません。その手順は次のとおりです。

情報を収集する
データのインポート
データのクリーニングと処理
テストとトレーニングの観察を分ける
モデルを選択
モデルのトレーニング
モデルをテストデータに適用する
評価結果
必要に応じてモデルを強化する
結果に満足するまで、手順 5 から 10 を繰り返します。

前回の記事では、Plotly ライブラリを使用して高頻度データをプロットする方法を示し、分析のためにデータを収集する方法を説明しました。リストのステップ 3 に直接進みましょう。ステップ 1 と 2 の実行方法を知りたい場合は、前の出版物を参照してください。

私たちの研究の質問は、「今後 1 時間の資産の終値はいくらになるか」です。

データクリーニング

MetaTrader を使用して予測する資産のデータをインポートした後、いくつかの変数を変更する必要があります。まず、変数の名前を定義します。

 #名前の設定 変数の
 
 col_names <- c( "日付" 、 "始値" 、 "高値" 、 "安値" 、 "終値" 、 "ティック" 、 "出来高" ) 
 
 colnames(データ) <- col_nameshead(データ)

データは次の形式になります:

> データ — 著者による画像

利用可能な変数のうち、始値、高値、安値、終値、およびボリュームのみを使用します。このようにして、他者を排除します。

 data$日付<- NULL   
 
データ$ティック <- NULL

次の観測値の終値を知りたいので、次の値を1行上に移動する必要があります。これを行うには、関数を作成し、元のデータセットに新しいデータを含む変数を作成します。

 # 指定された変数のn行を上にシフトするshift <- function (x, n) { c(x[-(seq(n))], rep(NA, n))}data$shifted <- shift(data$ Close , 1)tail(data)

> データ — 著者による画像

上記の最初の行で変数 Close の値を割り当てたことに注意してください。この方法では、最後の行に NA があり、na.omit() 関数を使用してその行を省略します。

 #NA 観測データを削除 <- na.omit(data)write.csv(data, "data.csv" )

完璧です。モデリングを開始するためのデータが準備できました。

データの分割

この問題では、人工知能モデルを分析およびトレーニングするための完全なソリューションを提供する H2O.ai というソフトウェアパッケージを使用します。ユーザーフレンドリーな構造により、データサイエンスの知識がない人でも複雑な問題を解決できます。まずライブラリを環境にロードしましょう:

 #パッケージのインストールinstall.packages( "h2o" )#ライブラリの読み込み library(h2o)

インストールしてロードしたら、モデルを構築するための基盤として使用される仮想マシンを起動します。仮想マシンを起動するときに、必要なコア数とメモリパラメータを設定する必要があります。

 #すべてのスレッド (-1)と16 GBのメモリを使用して仮想マシンを初期化しますh2o.init(nthreads = -1, max_mem_size = "16g" )

データをインポート:

 h2o.importFile( "data.csv" )h2o.describe(データ)

> データを水に変える — 著者による画像

ここで、データセット内で予測する変数と、モデルを「教える」ために使用される変数を定義します。

 y <- "shifted" #予測したい変数x <- setdiff(names(data), y)

次に、トレーニングデータの 80% の比率でデータをトレーニングとテストに分割します。

パーツ <- h2o.splitFrame(データ、.80) トレーニング <- パーツ[[1]] テスト <- パーツ[[2]]

データをセグメント化した後、H2O.ai パッケージの驚くべき部分に進みます。

モデルを選択

すべてのデータサイエンティストが機械学習プロジェクトを作成するときに実行する必要があるタスクの 1 つは、予測を行うための最適なモデルまたはモデルセットを決定することです。特定のタスクに最適なものを選択するには、多くの知識、特に数学の確固たる基礎が必要です。

H2O.ai パッケージを使用すると、他の懸念事項にも対処しながら、最適なモデルを選択するように要求できます。これを自動モデリングと呼びます。明らかに、この種の魔法は問題を解決する最も効率的な方法ではないかもしれませんが、良いスタートです。

モデルのトレーニング

モデルを作成するには、automl 関数を呼び出して、次のように必要なパラメータを渡します。

オートモデル <- h2o.automl(x, y, トレーニング, テスト, max_runtime_secs=120)

数分後には、パフォーマンス別に分類されたモデルのリストが表示されます。詳細については、下記までお電話ください。

オートモデル@リーダー

> モデルの説明 — 著者による画像

アプリケーションモデル

リーダーができたので、それをテストデータに適用してみましょう。モデルがまだ観測していないデータを使用してパフォーマンスを評価するので、ここが面白いところです。

モデルとテストデータを引数として、予測関数を呼び出します。

予測 <- h2o.predict(automodel@leader, test)

結論は

この記事では、資産の財務データを処理および操作し、データを分析してから 1 時間以内に終値を予測する機械学習モデルを簡単に作成する方法を説明しました。

モデルの評価と最適化については次の記事で説明します。

ではまた来週！

<<: AIの力を借りれば、罠だらけのジムは歴史の舞台から消えるのでしょうか？

>>: スマートワーク: AI がリモートワークをどう変えるのか

ブログ

IBM Cloud Pack for Data が Wunderman Thompson の再開ガイドの作成を支援

機械学習を使って株価を予測する非常に簡単な方法

IBM Cloud Pack for Data が Wunderman Thompson の再開ガイドの作成を支援

Deeplearning4j: JVM 向けのディープラーニングと ETL

2022 年の AI 開発とイノベーションのトップ 10 トレンド

調査レポート：2021年の人工知能開発動向予測

Alibaba が MNNKit をオープンソース化: Android と iOS をサポートする MNN ベースのモバイルディープラーニング SDK

ホーキング博士は、人工知能が AI の世界的な商業的発展を止めることはできないと警告しています。これは祝福でしょうか、それとも呪いでしょうか?

推薦する

アルゴリズムの時間計算量分析: Big O 表記

AIのマインドリーディングがサミットであなたを驚かせる！モデルが脳波を翻訳し、人間の思考がスクリーンに映し出される｜NeurIPS 2023

AI モデルに新たな革命が起こるのでしょうか?脳の記憶は回転するのでしょうか？過去と未来は実際には「直交」した空間である

加速を解き放つ、8月の自動運転業界の動向の概要

自動運転のジレンマと選択

勝てないなら参加する：ChatGPT が収益に影響を及ぼしていると認めた最初の企業 Chegg は、AI を採用し従業員を 4% 削減することを選択しました。

AIに勝てずイ・セドルが引退を発表

人工知能、機械学習、ディープラーニングの違い

人工知能（AI）が商業ビルのアプリケーションで成功を収める

スタンフォード大学は、GPT-4 が「愚か」になったことを確認しました。数学の問題のエラー率はわずか 3 か月で 40 倍に増加しました。 OpenAIも不安を感じている：調査が始まった