AI 株神: 機械学習を使って株価を予測するには?

この記事は、公開アカウント「Reading the Core」（ID: AI_Discovery）から転載したものです。

まず、この記事は H2o.ai 機械学習フレームワークの開始方法を示すだけであり、投資や財務に関するアドバイスを目的としたものではないことを強調しておきます。この記事のみに基づいて投資や財務管理の決定を行わないでください。

[[333548]]

この記事では、R 言語と H2o.ai 機械学習フレームワークを使用して株価を予測する方法を説明します。このフレームワークは Python でも使用できますが、著者は R 言語に精通しているため、この記事では R 言語を使用してデモンストレーションを行います。詳細な手順は次のとおりです。

データの収集
データのインポート
データの整理と操作
分割テストとトレーニングの観察
モデルを選択
モデルのトレーニング
モデルによるデータのテスト
評価結果
必要に応じてモデルを改善する
結果に満足するまで、手順 5 から 10 を繰り返します。

この論文で研究されている質問は、「今後 1 時間の株価の終値はいくらになるか」です。

データの照合

MetaTrader ソフトウェアを通じて予測したい資産のデータをインポートした後、いくつかの変数を変更する必要があります。まず、変数名を定義します。

 #変数名の設定
col_names < - c("日付", "始値", "高値", "安値", "終値", "ティック", "出来高")
 colnames(データ) < - col_names
ヘッド(データ)

データ形式は次のとおりです。

始値、最高値、最低値、終値、取引量など、利用可能なデータのみを使用するため、他のデータをクリアする必要があります。

データ$日付< - NULL
データ$ティック< - NULL

次の観測期間の終値を知りたいので、次の値を前の行に移動する必要があります。関数を作成し、元のデータセットの変数を新しいデータで設定する必要があります。

 # 指定された変数の n 行を上にシフトする
シフト< -関数(x, n) {
 c(x[-(seq(n))], 繰り返し(NA, n))
 }
データ$シフト< -シフト(データ$Close, 1)
末尾(データ)

前の行で変数 ClosePrice に値を割り当てていることに注意してください。したがって、最後の行には NA があり、na.omit() 関数を使用してこの行をスキップします。

 #NA 観測値を削除
データ< - na.omit(データ)
 write.csv(データ、"data.csv")

データの準備ができたので、モデリングを開始できます。

データの分割

[[333549]]

H2O.ai を使用したデータセグメンテーション。 H2O.ai は、人工知能モデルの分析とトレーニングのための完全なソリューションを提供します。使い方は非常に簡単で、データサイエンスの知識がなくても複雑な問題を解決することができます。まずH2O.aiをダウンロードします:

 #パッケージのインストール
インストールパッケージ("h2o") 
 
 #ライブラリの読み込み
ライブラリ(h2o)

インストールがロードされたら、モデリングに使用する仮想マシンを起動します。仮想マシンを起動するときに、必要なコア数とメモリパラメータを設定する必要があります。

 #すべてのスレッド (-1) と 16 GB のメモリを使用して仮想マシンを初期化します
h2o.init( nthreads = -1、 max_mem_size = "16g" )

データをインポート:

 h2o.importFile("data.csv")
 h2o.describe(データ)

次に、データセット内で予測する変数と、モデルのトレーニングに使用する変数を定義します。

 y < - 「シフトされた」#予測したい変数
x < - setdiff(names(data), y)

その後、データはトレーニング用とテスト用に分割され、80% がトレーニングデータとして使用されます。

パーツ< - h2o.splitFrame(データ、.80)
列車< -部品[[1]]
テスト< -部品[[2]]

これらの手順を完了したら、H2O.ai が魔法を生み出す様子を見てみましょう。

モデルを選択

すべてのデータサイエンティストが独自の機械学習プロジェクトを作成するときに実行する必要があるタスクの 1 つは、予測を行うための最適なモデルまたはモデルセットを特定することです。特定のタスクに最適なソリューションを決定するには、多くの知識、特に深い数学的基礎が必要です。

H2O.ai を使用すると最適なモデルを選択できるため、他の問題を解決するために時間を節約できます。これが自動モデリングです。これは問題を解決する最も効率的な方法ではないかもしれませんが、試してみる価値はあります。

モデルのトレーニング

モデルを作成するには、automl 関数を呼び出して必要なパラメータを渡す必要があります。

オートモデル< - h2o.automl(x, y, トレーニング、テスト、 max_runtime_secs = 120 )

数分後には、パフォーマンス順にランク付けされたモデルのリストが表示されます。

モデルの使用

これで、モデルを使用してデータをテストできます。また、モデルとテストデータを引数として predict 関数を呼び出すことで、モデルを使用して観測されていないデータでのパフォーマンスを評価することもできます。

予測< - h2o.predict(automodel@leader, test)

さて、1時間待って、あなたの予測が当たるかどうか見てみましょう。

免責事項: この記事は投資アドバイスではありません。株価を予測するのは簡単な作業ではありません。この記事は、H2O.ai を使用して機械学習の問題を簡単に解決できることを単純に説明しています。株価の変動を予測するのは非常に簡単ですが、予測が常に正しい、または正確であるとは限りません。

<<: Microsoft XiaoIce がスピンオフしました!沈向陽氏が会長に就任、「小氷の父」がCEOに就任、中国での事業化を目指す

>>: 人工知能の主な発展とその原動力

完全な自動運転はまだ遠い未来です。なぜ AI 搭載の「自動運転」車を運転する必要があるのでしょうか?

AI 株神: 機械学習を使って株価を予測するには?

完全な自動運転はまだ遠い未来です。なぜ AI 搭載の「自動運転」車を運転する必要があるのでしょうか?

ChatGPT が「Paper Artifact」プラグインをリリースしました。キーワードなしで2億件の記事を検索、リンクは完全に本物です

必要なパラメータはわずか1%で、その効果はControlNetを上回る。新しいAI塗装制御マスターが登場

多くのビッグデータサイエンティストが仕事を辞めた？理由を説明しましょう。

このアルゴリズムチームは 2020 年に何をしましたか?

マイクロソフトの年次研究レビュー: ML のブレークスルーが到来、人間とコンピューターのインタラクションがより現実的に、そして Shum 氏のお別れ

ハイパーオートメーション: 次世代のサイバーセキュリティソリューション

GPT-4Vに匹敵し、120万データと8つのA100のみを使用し、トレーニングは1日で完了し、LLaVA-1.5は11のベンチマークSOTAを更新しました。

推薦する

マイクロソフトCEOナデラ氏：AIはルールを変えるインターネットの波のようなもの

AIに単純なことを教える: ゼロから最初のニューラルネットワークを構築する

GPT-4 に匹敵するオープンソースモデルがリークされました。ミストラルのボスが確認: 正式版はさらに強力になる

AutoAI: ModelOps と DevOps を同期してデジタル変革を推進

RDA を使用してデータの問題を解決し、AIOps の実装を加速する方法

CCNP: BGP プロトコルの最適パス選択アルゴリズムの公開

自動運転システム向けBEV 3D検出改善戦略の総合分析

ロボットの時代が来ます。私たちは全員失業してしまうのでしょうか？