定量的・機械学習アプローチ

概要

定量的アプローチは、統計モデルや機械学習アルゴリズムを用いて商品先物の価格予測やシグナル生成を行う手法である。特徴量エンジニアリング、モデル選択、バックテスト設計が成功の鍵となる [1]。

理論的背景

機械学習モデルは、線形モデルでは捕捉できない非線形な価格パターンを学習する能力を持つ。Li et al. (2024) のメタ分析では、LSTM やアンサンブル手法が商品先物予測において伝統的な時系列モデルを上回ることが確認されている [1]。ただし、過剰適合のリスクが高く、適切な検証プロセスが不可欠である。

戦略1: 特徴量エンジニアリングとML予測

前提条件

  • 日足の OHLCV データ(最低2年分)

  • Python 環境と ML ライブラリ

実装手順

  1. 特徴量を設計する:

    • テクニカル指標: EMA(20), RSI(14), ADX(14), CCI(20), ボリンジャーバンド幅

    • ラグ特徴量: 過去1-5日のリターン、出来高変化率

    • カレンダー特徴量: 曜日、月、四半期

    • クロス商品特徴量: 金/白金比率、原油/金比率

  2. ターゲット変数を定義する: 翌日リターンの方向(上昇/下落)

  3. ウォークフォワード法でモデルを学習・評価する

  4. モデル出力を確率として解釈し、閾値を超えた場合にポジション構築する

パラメータ

パラメータ

推奨値

根拠

学習期間

252日(1年)

市場レジームの反映

検証期間

63日(3ヶ月)

ウォークフォワード

特徴量数

15-30

過剰適合の回避

エントリー確率閾値

0.6

高確信度シグナルのみ

適用商品

商品

適合度

備考

データ量が豊富(tick~month)

白金

同上

原油

同上

金ミニ

金と同一の価格特性

データ参照

  • OHLCV: data/csv/金_YYYYMM_day.csv(全時間足利用可能)

  • 板情報: data/orderbook.json(全フィールド)

戦略2: アンサンブル手法

前提条件

  • 複数のベースモデルが構築済みであること

  • 十分な学習データ量

実装手順

  1. 複数のベースモデルを構築する:

    • ランダムフォレスト(RF)

    • XGBoost / LightGBM

    • LSTM(時系列パターン用)

  2. 各モデルの予測を多数決またはスタッキングで統合する

  3. モデル間の予測が一致した場合のみポジション構築する

  4. 不一致の場合はポジション回避(確信度が低い)

パラメータ

パラメータ

推奨値

根拠

ベースモデル数

3-5

多様性の確保

合意閾値

全モデル一致

高確信度フィルター

リトレーニング頻度

月次

レジーム変化への適応

適用商品

商品

適合度

備考

データ量と流動性が十分

原油

同上

白金

データ量は十分だがボラティリティが高い

データ参照

  • OHLCV: data/csv/金_YYYYMM_day.csv

戦略3: バックテスト・ウォークフォワード最適化

前提条件

  • 戦略ロジックが定義済みであること

  • 十分な期間のヒストリカルデータ

実装手順

  1. データを学習期間・検証期間・テスト期間に分割する

  2. 学習期間でパラメータを最適化する

  3. 検証期間で過剰適合をチェックする(学習vs検証のパフォーマンス差)

  4. テスト期間で最終評価する(未使用データ)

  5. ウォークフォワード: 期間をスライドさせて複数回実行し、頑健性を確認する

パラメータ

パラメータ

推奨値

根拠

学習期間

2年

十分なサンプル

検証期間

6ヶ月

過剰適合検出

テスト期間

6ヶ月

アウトオブサンプル評価

ウォークフォワード回数

4回以上

統計的信頼性

評価指標

指標

最低基準

説明

シャープレシオ

> 1.0

リスク調整後リターン

最大ドローダウン

< 20%

リスク許容度

勝率

> 50%

シグナルの精度

プロフィットファクター

> 1.5

利益/損失比率

データ参照

  • OHLCV: 全商品・全時間足の data/csv/ ファイル

リスクと注意点

  • 過剰適合(オーバーフィッティング)は ML 戦略最大のリスクである

  • ウォークフォワード検証なしのバックテスト結果は信頼できない

  • 特徴量のデータスヌーピング(将来情報の混入)に厳重に注意する

  • 市場レジームの変化により、学習済みモデルの性能が劣化する(コンセプトドリフト)

  • 計算コストとリトレーニング頻度のトレードオフを考慮する

出典

  1. Li, Z. et al. “How good are different machine and deep learning models in forecasting commodity futures prices?”. Resources Policy, 2024. https://www.sciencedirect.com/science/article/pii/S0301420724004070


免責事項: 本ドキュメントは教育目的の情報提供です。実際の投資判断は投資家自身の責任で行ってください。過去のパフォーマンスは将来の結果を保証するものではありません。先物取引はレバレッジ商品であり、高いリスクを伴います。