機械学習を使って株価を予測する非常に簡単な方法

[[336572]]

この記事では、H2o.ai フレームワークを使用した機械学習を使用して R 言語で株価を予測する手順を段階的に説明しました。このフレームワークは Python でも使用できますが、私は R に慣れているため、このチュートリアルでは R 言語を使用します。「人工知能を使って株価を予測するにはどうしたらいいのだろう？」と疑問に思ったことがあるかもしれません。その手順は次のとおりです。

情報を収集する
データのインポート
データのクリーニングと処理
テストとトレーニングの観察を分ける
モデルを選択
モデルのトレーニング
モデルをテストデータに適用する
評価結果
必要に応じてモデルを強化する
結果に満足するまで、手順 5 から 10 を繰り返します。

前回の記事では、Plotly ライブラリを使用して高頻度データをプロットする方法を示し、分析のためにデータを収集する方法を説明しました。リストのステップ 3 に直接進みましょう。ステップ 1 と 2 の実行方法を知りたい場合は、前の出版物を参照してください。

私たちの研究の質問は、「今後 1 時間の資産の終値はいくらになるか」です。

データクリーニング

MetaTrader を使用して予測する資産のデータをインポートした後、いくつかの変数を変更する必要があります。まず、変数の名前を定義します。

 #名前の設定 変数の
 
 col_names <- c( "日付" 、 "始値" 、 "高値" 、 "安値" 、 "終値" 、 "ティック" 、 "出来高" ) 
 
 colnames(データ) <- col_nameshead(データ)

データは次の形式になります:

> データ — 著者による画像

利用可能な変数のうち、始値、高値、安値、終値、およびボリュームのみを使用します。このようにして、他者を排除します。

 data$日付<- NULL   
 
データ$ティック <- NULL

次の観測値の終値を知りたいので、次の値を1行上に移動する必要があります。これを行うには、関数を作成し、元のデータセットに新しいデータを含む変数を作成します。

 # 指定された変数のn行を上にシフトするshift <- function (x, n) { c(x[-(seq(n))], rep(NA, n))}data$shifted <- shift(data$ Close , 1)tail(data)

> データ — 著者による画像

上記の最初の行で変数 Close の値を割り当てたことに注意してください。この方法では、最後の行に NA があり、na.omit() 関数を使用してその行を省略します。

 #NA 観測データを削除 <- na.omit(data)write.csv(data, "data.csv" )

完璧です。モデリングを開始するためのデータが準備できました。

データの分割

この問題では、人工知能モデルを分析およびトレーニングするための完全なソリューションを提供する H2O.ai というソフトウェアパッケージを使用します。ユーザーフレンドリーな構造により、データサイエンスの知識がない人でも複雑な問題を解決できます。まずライブラリを環境にロードしましょう:

 #パッケージのインストールinstall.packages( "h2o" )#ライブラリの読み込み library(h2o)

インストールしてロードしたら、モデルを構築するための基盤として使用される仮想マシンを起動します。仮想マシンを起動するときに、必要なコア数とメモリパラメータを設定する必要があります。

 #すべてのスレッド (-1)と16 GBのメモリを使用して仮想マシンを初期化しますh2o.init(nthreads = -1, max_mem_size = "16g" )

データをインポート:

 h2o.importFile( "data.csv" )h2o.describe(データ)

> データを水に変える — 著者による画像

ここで、データセット内で予測する変数と、モデルを「教える」ために使用される変数を定義します。

 y <- "shifted" #予測したい変数x <- setdiff(names(data), y)

次に、トレーニングデータの 80% の比率でデータをトレーニングとテストに分割します。

パーツ <- h2o.splitFrame(データ、.80) トレーニング <- パーツ[[1]] テスト <- パーツ[[2]]

データをセグメント化した後、H2O.ai パッケージの驚くべき部分に進みます。

モデルを選択

すべてのデータサイエンティストが機械学習プロジェクトを作成するときに実行する必要があるタスクの 1 つは、予測を行うための最適なモデルまたはモデルセットを決定することです。特定のタスクに最適なものを選択するには、多くの知識、特に数学の確固たる基礎が必要です。

H2O.ai パッケージを使用すると、他の懸念事項にも対処しながら、最適なモデルを選択するように要求できます。これを自動モデリングと呼びます。明らかに、この種の魔法は問題を解決する最も効率的な方法ではないかもしれませんが、良いスタートです。

モデルのトレーニング

モデルを作成するには、automl 関数を呼び出して、次のように必要なパラメータを渡します。

オートモデル <- h2o.automl(x, y, トレーニング, テスト, max_runtime_secs=120)

数分後には、パフォーマンス別に分類されたモデルのリストが表示されます。詳細については、下記までお電話ください。

オートモデル@リーダー

> モデルの説明 — 著者による画像

アプリケーションモデル

リーダーができたので、それをテストデータに適用してみましょう。モデルがまだ観測していないデータを使用してパフォーマンスを評価するので、ここが面白いところです。

モデルとテストデータを引数として、予測関数を呼び出します。

予測 <- h2o.predict(automodel@leader, test)

結論は

この記事では、資産の財務データを処理および操作し、データを分析してから 1 時間以内に終値を予測する機械学習モデルを簡単に作成する方法を説明しました。

モデルの評価と最適化については次の記事で説明します。

ではまた来週！

<<: AIの力を借りれば、罠だらけのジムは歴史の舞台から消えるのでしょうか？

>>: スマートワーク: AI がリモートワークをどう変えるのか

この論文では、688件の大規模モデル論文を分析し、LLMの現在の課題と応用について検討する。

機械学習を使って株価を予測する非常に簡単な方法

この論文では、688件の大規模モデル論文を分析し、LLMの現在の課題と応用について検討する。

人工知能と自然言語処理技術が産業のアップグレードエンジンを牽引

設計原則、テスト指標...顔アルゴリズムテストのハードコアスキルを体系的に整理

人工知能はよりクールで実用的

AIは期待に応えられていない？これらの人為的ミスが発生した可能性がある

マスク氏、マイクロソフトを非難「OpenAIはあなたのツールではない」

AIが有名人に似た人を紹介

推薦する

人工知能は進歩しすぎているのでしょうか?この記事を読めば、誰もが人工知能の歴史を理解できる

アルゴリズムによるレイオフによって解き放たれる「悪の花」とは？

ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める

解釈可能な機械学習のための Python ライブラリ

今後5年間の人工知能における5つのブレークスルー

「ソースコード解析」仮想DOMアルゴリズムの実装方法

AIアーキテクトとはどのような人達でしょうか？

これら10機関からの24の調査データはAIのトレンドを理解するのに役立ちます

小鵬汽車と徳賽SV自動車有限公司がレベル3自動運転システムの開発で協力

シリコンチップ上に15万量子ビット：単一スピンの初の光学検出がNature誌に掲載

サイバーセキュリティを変える、最もホットなハッカーツール：武器化された人工知能FraudGPT

インテリジェントアシスタントが、設計から運用、保守まで、ソフトウェア開発プロセス全体を処理します。