NSNテキストセンチメント分析¶
概要¶
NSN(ミンカブ・ジ・インフォノイド)が提供する金融ニュース・為替市況のバックナンバーテキストから、キーワードベースのセンチメント指標を構築し、商品先物の週次リターン予測への活用可能性を検証した。テキストデータからの投資シグナル構築は先行研究でも検討されている [2][3]。7年分(2019年1月〜2026年2月)の約17,800本の記事を対象とし、ルールベースのベースラインモデルで相関分析を実施した。
データソース¶
NSNバックナンバー¶
NSNサイトから定期クロールで取得した3カテゴリのバックナンバー記事を使用する。
カテゴリ |
記事数 |
サイズ |
期間 |
内容 |
|---|---|---|---|---|
金融ニュース |
14,078 |
18MB |
2019/01〜2026/02 |
マーケットエッジ分析(短期見通し・論点解説・レビュー)、NY外国為替速報 |
為替市況 |
1,853 |
6.6MB |
2019/01〜2026/03 |
NY為替市場概況(日次) |
株式市況 |
1,853 |
9.1MB |
2019/01〜2026/03 |
NY株式市場概況(日次) |
データ格納場所: nsn_data/news/overseas_financial_news_backnumber/articles/、nsn_data/news/financial/forex_backnumber/articles/、nsn_data/news/financial/stock_backnumber/articles/
記事の構造¶
各ファイルは月単位(例: afk2510.md)で、● 区切りで複数の日次記事を含む。金融ニュースの記事は以下の6タイプに分類される:
記事タイプ |
本数 |
時間帯 |
内容 |
|---|---|---|---|
短期見通しダウ平均 |
~1,766 |
11:00頃 |
ダウ平均の方向性予測(最も前向き) |
短期見通しドル円 |
~1,767 |
11:00頃 |
ドル円の方向性予測(最も前向き) |
論点解説ダウ平均 |
~1,736 |
11:00頃 |
当日の注目材料の構造的分析 |
論点解説ドル円 |
~1,764 |
11:00頃 |
同上 |
レビューダウ平均 |
~1,569 |
08:00頃 |
前日NY市場の事後レビュー |
レビュードル円 |
~1,706 |
08:00頃 |
同上 |
執筆: マーケットエッジ・小菅努氏(全記事共通)
ゴールドレポート¶
NSNが週次で発行する金市場の専門レポート。バックナンバーのタイトルに方向性見通しが凝縮されている。
項目 |
内容 |
|---|---|
発行頻度 |
週1回(土曜日付) |
データ期間 |
2022/02〜2026/03(約210号) |
形式 |
Markdown テーブル(タイトル + PDF リンク) |
タイトル例 |
「米利下げ観測後退が重石も地政学不安に支えられる」 |
データ格納場所: nsn_data/reports/gold_report/
価格データ¶
足種 |
期間 |
サンプル数 |
記事との重複 |
|---|---|---|---|
週足 |
2018/07〜2026/03 |
400週 |
374週(2019/01〜) |
月足 |
1992/12〜2026/03 |
295〜400月 |
86ヶ月(2019/01〜) |
日足 |
2024/07〜2026/03 |
400日 |
400日 |
データ参照: day_bars Parquet(interval_type = 'week')
戦略1: ルールベース・センチメント指標(ベースライン)¶
前提条件¶
NSNバックナンバー記事(金融ニュース + 為替市況)
週足 OHLCV データ
実装手順¶
記事を
●区切りでパースし、日付・タイトル・本文を抽出するタイトルと本文中のキーワード出現頻度でセンチメントを分類する。辞書ベースのテキスト分類手法は Loughran and McDonald [1] のアプローチに基づく:
分類 |
キーワード例 |
|---|---|
Bullish |
押し目買い、堅調、底固、リスクオン、買い優勢、一段高、反発、利下げ期待 |
Bearish |
上値重い、軟調、弱気、リスクオフ、急落、下値不安、パニック、全面安、米国売り、キャリー解消 |
Neutral |
上記いずれにも該当しない、または強弱が拮抗 |
ISO 週単位でセンチメントスコアを集約する(週内記事の平均値)
翌週の商品先物リターンとの相関を計算する
パラメータ¶
パラメータ |
値 |
根拠 |
|---|---|---|
最小記事数/週 |
3(金融ニュース)、2(為替市況) |
ノイズ抑制 |
Bullish 閾値 |
週平均スコア > +0.1 |
弱いシグナルの除外 |
Bearish 閾値 |
週平均スコア < −0.1 |
同上 |
実証結果¶
センチメント分布¶
14,078本の金融ニュース記事の分類結果:
分類 |
記事数 |
比率 |
|---|---|---|
Bullish |
4,843 |
34.4% |
Neutral |
5,775 |
41.0% |
Bearish |
3,460 |
24.6% |
Dow見通しセンチメント → 商品先物翌週リターン(n=362週、2019/01〜2026/02)¶
商品 |
相関係数 |
Bullish的中率 |
Bearish的中率 |
Bullish平均リターン |
Bearish平均リターン |
|---|---|---|---|---|---|
金 |
+0.048 |
63.8% |
42.3% |
+0.507%/週 |
+0.413%/週 |
原油 |
+0.038 |
57.7% |
47.1% |
+0.233%/週 |
−0.138%/週 |
白金 |
+0.026 |
52.6% |
48.1% |
+0.503%/週 |
+0.199%/週 |
ゴム |
+0.100 |
54.9% |
51.9% |
+0.306%/週 |
−0.333%/週 |
USD/JPY見通しセンチメント → 商品先物翌週リターン(n=362週)¶
商品 |
相関係数 |
備考 |
|---|---|---|
金 |
−0.046 |
ドル円弱気(円高)時に金が上昇する傾向 |
原油 |
−0.059 |
同上 |
白金 |
−0.059 |
同上 |
ゴム |
−0.054 |
同上 |
為替市況記事センチメント → 商品先物翌週リターン(n=373週)¶
商品 |
相関係数 |
Bullish的中率 |
Bearish的中率 |
Bullish平均リターン |
Bearish平均リターン |
|---|---|---|---|---|---|
金 |
+0.011 |
64.3% |
40.4% |
+0.534%/週 |
+0.454%/週 |
原油 |
−0.111 |
53.6% |
36.0% |
−0.021%/週 |
+0.677%/週 |
白金 |
−0.009 |
53.6% |
50.0% |
+0.550%/週 |
+0.601%/週 |
ゴム |
+0.031 |
52.6% |
45.6% |
+0.414%/週 |
−0.071%/週 |
主要な発見¶
金のDow Bullish的中率 63.8%: Dow見通しが強気の週、翌週の金は63.8%の確率で上昇した。リスクオン環境で金も買われる「リスクオン + インフレヘッジ」の複合効果を反映している
ゴムのDow相関 +0.100: 全組合せ中最大。ゴムは景気敏感商品であり、株式市場のセンチメントが直接波及する合理的な関係
原油のドル円逆相関 −0.111: ドル円が強気(円安)と報じられた翌週に原油が下落する傾向。ドル高が原油安を促すメカニズムを反映している可能性がある
USD/JPY見通しと全商品の逆相関: ドル円弱気(円高方向)のセンチメントが翌週の商品価格上昇と相関する一貫した傾向が全4商品で確認された
評価¶
観点 |
評価 |
|---|---|
単独での予測力 |
弱い(相関係数 0.03〜0.11)。単体の売買シグナルとしては不十分 |
補助シグナルとしての価値 |
あり。特に金のDow Bullish的中率 63.8%、ゴムのDow相関 +0.10 は既存テクニカル戦略の補助フィルタとして有用 |
改良の余地 |
大きい。ルールベースは粗い Bag-of-Words であり、改良の方向性が複数存在する(後述) |
主要イベント期の記事先行性検証¶
5つの主要相場変動期について、記事内容と価格データを照合し、先行性を検証した。
コロナショック + 原油暴落(2020年3月)¶
金: 週間 −6.44%、原油: 週間 −21.12%
3/12の記事で「金に続いて米国債など安全資産も売却されている」「1998年のLTCM危機と類似」と構造的分析を提示。全資産同時暴落の背景を理解する先行的洞察
「キャッシュ化」という概念の提示は、その後の流動性危機深化を示唆
日銀利上げショック(2024年8月5日)¶
金: −6.34%、原油: −9.54%
8/6の記事で「円キャリートレード解消は JPモルガンは60%程度、UBSは50%程度の完了状態」と定量的な先行情報を提供。追加下落リスクの定量的評価であり、ポジションサイジングに直結
8/7の記事で日銀・内田副総裁の会見に注目を促し、翌日のハト派発言による円高反転を事前に示唆
高市トレード → 金急騰(2025年9月末〜10月)¶
金: 5週間で +25.92%
10/7の記事で「財政赤字・公的債務の拡大」「高市氏は財政規律を重視する声明を出さざるを得なくなる可能性が高い」と反転条件を事前に特定
10/8の記事で「チャート上は155円まで抵抗線が見当たらない」と上値目処を提示
トランプ関税ショック(2025年4月)¶
原油: 4/7に −8.30%、4/10に +6.62%
4/10の記事で「米長期国債売り、ドル売り、米国株売りと、米資産は全面安」というフレーミングを提示。従来の「リスクオフ → 米国債買い → ドル高」が崩れたパラダイムシフトの先行認識
「債券市場は非常に厄介だ」というトランプ発言から、関税停止の真の動機を分析
金の急騰→暴落(2026年1月29日〜2月2日)¶
1/29: +6.55%、2/2: −15.00%
1/30の記事で「FRB次期議長にウォーシュ元FRB理事を指名」「タカ派色が最も強い」と分析。金 −15% 暴落の最大のトリガー要因を事前に特定
先行性の総合評価¶
評価軸 |
結果 |
|---|---|
先行性 |
あり(条件付き)。直接的な価格予測ではないが、反転条件・構造要因・上値/下値目処の提示に先行性がある |
投資判断への有用性 |
高い。特にポジションの方向性判断、リスク管理の強化/緩和判断、マーケットレジームの変化認識に有用 |
最も先行性の高い記事タイプ |
「短期見通し」(方向性予測)、「論点解説」(構造的理解) |
限界 |
「先行シグナル」というよりは「判断材料の整理と構造化」。定量シグナルとしてそのまま使うのは難しい |
戦略2: TF-IDF + ロジスティック回帰(ML改良)¶
前提条件¶
戦略1と同じデータ(NSNバックナンバー記事 + 週足 OHLCV)
scikit-learn(TfidfVectorizer, LogisticRegression)
手法¶
ルールベースの固定キーワードリストを排し、TF-IDFベクトル化で記事テキスト全体から統計的に重要な語彙を自動抽出する。
週内の全記事テキスト(タイトル + 本文)を結合
文字レベル n-gram(2〜4文字、
char_wb)で TF-IDF ベクトル化(最大2,000特徴量)L1正則化ロジスティック回帰(C=0.1)で翌週リターンの方向(上昇/下落)を分類
ウォークフォワード検証: 最低52週の訓練窓から開始し、1週ずつ前進
パラメータ選択の根拠¶
パラメータ |
値 |
根拠 |
|---|---|---|
analyzer |
|
日本語は空白区切りがなく、形態素解析器への依存を回避。文字レベル n-gram が有効 |
ngram_range |
(2, 4) |
「利下げ」「急落」等の2〜4文字キーワードを捕捉 |
max_features |
2,000 |
高次元スパース特徴量のオーバーフィット抑制 |
C(正則化強度) |
0.1 |
強めの正則化。サンプル数(~300週)に対して特徴量が多いため |
L1正則化 |
l1_ratio=1.0 |
スパース解を促進し、重要な語彙を自動選択 |
min_train_weeks |
52 |
最低1年の学習データを確保 |
実証結果¶
ウォークフォワード検証結果(n=313週、2020/01〜2026/02)¶
商品 |
Accuracy |
Baseline |
Bullish的中率 |
Bearish的中率 |
IC(Spearman) |
|---|---|---|---|---|---|
金 |
57.2% |
61.7% |
62.1% |
40.0% |
+0.011 |
原油 |
50.8% |
57.2% |
55.1% |
34.8% |
−0.136 |
白金 |
47.6% |
52.4% |
0.0% |
47.6% |
+0.000 |
ゴム |
47.6% |
53.7% |
70.0% |
46.9% |
+0.057 |
Baseline: 多数派クラス(常に上昇と予測)の精度
分析¶
Baseline Accuracy を超える商品がない: 全商品でモデル精度が多数派予測を下回った。TF-IDF char n-gram だけでは、ルールベースのキーワード分類と同等以上の予測力を得られなかった
金の Bullish 的中率 62.1%: 戦略1(63.8%)と同水準。テキストから「上昇シグナル」を検出する能力は維持されている
ゴムの Bullish 的中率 70.0%: 予測が bullish と判定された場合の方向性は高いが、bullish 予測自体が少ない
白金の Bullish 予測ゼロ: モデルが保守的すぎて常に bearish を予測。L1 正則化が強すぎる可能性
IC(情報係数)が極めて低い: 予測確率とリターンの順位相関がほぼゼロ。確率値自体に信頼性がない
考察: なぜ ML が改善しなかったか¶
要因 |
説明 |
|---|---|
特徴量の質 |
char n-gram は語彙の意味を捉えられない。「利下げ期待」と「利下げ見送り」が類似特徴量になる |
サンプル数不足 |
313週 × 2,000特徴量は典型的な「次元の呪い」。L1正則化だけでは不十分 |
ラベルの非定常性 |
テキスト→価格の関係が時間とともに変化。固定モデルでは追従できない |
記事タイプ混在 |
見通し記事とレビュー記事の特性が異なるが、同一特徴量空間に混在している |
戦略1 vs 戦略2 比較¶
観点 |
戦略1(ルールベース) |
戦略2(TF-IDF + LR) |
|---|---|---|
金 Bullish 的中率 |
63.8% |
62.1% |
ゴム相関/IC |
+0.100 |
+0.057 |
解釈可能性 |
高(キーワード明示) |
低(2,000次元ベクトル) |
運用コスト |
低 |
高(モデル再学習が必要) |
結論 |
現時点では戦略1が優位 |
特徴量の質的改善が前提 |
戦略3: イベント検出型特徴量 + センチメント交差項¶
前提条件¶
戦略1と同じデータ(NSNバックナンバー記事 + 週足 OHLCV)
scikit-learn(LogisticRegression)
手法¶
ドメイン知識に基づく11カテゴリのマクロイベントを記事から検出し、センチメント方向との交差項を含む構造化特徴量で予測する。
イベントカテゴリ(11種)¶
カテゴリ |
キーワード例 |
記事出現率 |
|---|---|---|
fomc |
FOMC、FRB、パウエル、連邦準備 |
35.1% |
rate_hike |
利上げ、タカ派、引き締め |
21.7% |
rate_cut |
利下げ、ハト派、緩和的 |
18.0% |
employment |
雇用統計、失業率 |
12.6% |
cpi |
CPI、消費者物価、インフレ率 |
11.2% |
boj |
日銀、植田、内田副総裁 |
8.8% |
ecb |
ECB、ラガルド |
8.1% |
geopolitical |
イラン、ウクライナ、中東、制裁 |
6.2% |
tariff |
関税、貿易摩擦 |
6.1% |
regime_shift |
パニック、米国売り、暴落、全面安 |
3.9% |
gdp |
GDP、リセッション |
3.9% |
特徴量構成(34次元)¶
特徴量グループ |
次元数 |
説明 |
|---|---|---|
ベースイベント頻度 |
11 |
週内記事でのイベント言及率(0〜1) |
センチメントスコア |
1 |
戦略1ルールベースの平均スコア |
交差項(event x bullish) |
11 |
イベント言及 かつ bullish 記事の割合 |
交差項(event x bearish) |
11 |
イベント言及 かつ bearish 記事の割合 |
交差項の設計意図: 「FOMC言及 + bearish」(利上げ懸念局面)と「地政学 + bearish」(紛争リスク局面)では商品への影響メカニズムが異なる。イベントの「文脈」をモデルに提供する。
実証結果¶
ウォークフォワード検証結果(n=313週、2020/01〜2026/02)¶
商品 |
Accuracy |
Baseline |
Bullish的中率 |
Bearish的中率 |
IC(Spearman) |
|---|---|---|---|---|---|
金 |
61.7% |
61.7% |
61.7% |
0.0% |
−0.080 |
原油 |
55.3% |
57.2% |
56.8% |
37.5% |
−0.075 |
白金 |
48.9% |
52.4% |
51.3% |
46.6% |
−0.038 |
ゴム |
47.0% |
53.7% |
50.5% |
40.9% |
−0.083 |
商品別の最重要特徴量(上位5位)¶
商品 |
1位 |
2位 |
3位 |
4位 |
5位 |
|---|---|---|---|---|---|
金 |
tariff (0.075) |
fomc (0.046) |
sentiment (0.037) |
rate_cut (0.031) |
rate_hike (0.029) |
原油 |
rate_cut (0.393) |
fomc (0.389) |
rate_hike (0.380) |
sentiment (0.201) |
geopolitical (0.108) |
白金 |
employment (0.409) |
cpi (0.233) |
rate_hike (0.055) |
geopolitical (0.016) |
fomc (0.004) |
ゴム |
rate_cut (0.186) |
tariff (0.182) |
fomc (0.038) |
geopolitical (0.035) |
sentiment (0.034) |
分析¶
交差項はL1正則化で完全に抑制された: 313サンプルに対して34特徴量は過剰。交差項22個はすべて係数ゼロに圧縮され、ベースイベント頻度11個 + sentiment_scoreのみがモデルに寄与
金のモデルは事実上「常にbullish予測」: accuracy = baseline = 61.7%。金が上昇基調の期間が長いため、モデルが多数派予測に収束
商品別の特徴量プロファイルに差異:
原油: 金融政策三要素(FOMC・利上げ・利下げ)が支配的(係数0.38〜0.39)。金融政策経由の需要見通しが原油価格を左右
白金: 雇用統計(0.41)とCPI(0.23)が突出。実体経済指標への感応度が最も高い
ゴム: 利下げ(0.19)と関税(0.18)の二大要因。景気敏感商品+貿易政策リスクの特性
金: tariff(0.075)が最重要だが係数は小さい。テキスト情報だけでは金価格の予測が困難
3戦略の総合比較¶
観点 |
戦略1(ルールベース) |
戦略2(TF-IDF) |
戦略3(イベント検出) |
|---|---|---|---|
金 Accuracy |
— |
57.2% |
61.7% |
金 Bullish 的中率 |
63.8% |
62.1% |
61.7% |
原油 最重要特徴量 |
— |
— |
FOMC/利上げ/利下げ |
解釈可能性 |
高 |
低 |
高(イベント名が明示) |
次元数 |
2(bull/bear) |
2,000 |
34(有効12) |
主な知見 |
方向性の相関確認 |
ML単独では不十分 |
商品別の感応構造を可視化 |
結論¶
イベント検出モデルの最大の成果は予測精度ではなく、商品ごとのイベント感応構造の発見である。原油がFOMC/金利政策に、白金が雇用統計/CPIに、ゴムが利下げ/関税に最も反応するという構造的知見は、テクニカル分析との組み合わせにおいてフィルタリング条件として活用できる。
戦略4: 定量情報抽出 + イベント統合モデル¶
前提条件¶
戦略3と同じデータ(NSNバックナンバー記事 + 週足 OHLCV)
scikit-learn(LogisticRegression)
手法¶
記事中の数値パターン(価格レンジ、サポート/レジスタンス、パーセンテージ、価格水準、移動平均線言及)を正規表現で抽出し、戦略3のイベント特徴量と統合する。
定量パターン(5種)と出現率¶
パターン |
正規表現の対象 |
記事出現率 |
|---|---|---|
価格レンジ |
「108〜109円」「2万0000〜2万1000ドル」 |
10.8% |
サポート/レジスタンス |
「支持線」「抵抗線」「サポート」「レジスタンス」 |
16.5% |
パーセンテージ |
「1.5%」「0.8%上昇」 |
39.1% |
価格水準 |
「2万5000ドル水準」「110円台」「107.50円付近」 |
52.4% |
移動平均線 |
「21日線」「200日線」「移動平均」 |
— |
特徴量構成(20次元)¶
特徴量グループ |
次元数 |
説明 |
|---|---|---|
イベント頻度(戦略3) |
11 |
FOMC、雇用統計、CPI等の週内言及率 |
センチメントスコア |
1 |
戦略1ルールベースの平均値 |
定量パターン |
5 |
価格レンジ/SR/百分率/価格水準/移動平均の週内平均出現数 |
定量密度 x bullish |
1 |
bullish記事内の定量パターン総出現数 |
定量密度 x bearish |
1 |
bearish記事内の定量パターン総出現数 |
テクニカル意識度 |
1 |
サポート/レジスタンス + 移動平均線の合計言及数 |
交差項の設計意図¶
quant_density_bullish/bearish: センチメントの「確信度」の代理変数。bullish記事に数値情報が多い場合、アナリストが定量的根拠を持って強気と判断していることを示唆
tech_awareness: テクニカル分析的な記事の密度。価格目処やチャートへの言及が多い週はテクニカル主導の相場
実証結果¶
ウォークフォワード検証結果(n=313週、2020/01〜2026/02)¶
商品 |
Accuracy |
Baseline |
Bullish的中率 |
Bearish的中率 |
IC(Spearman) |
|---|---|---|---|---|---|
金 |
60.7% |
61.7% |
61.4% |
20.0% |
+0.000 |
原油 |
54.0% |
57.2% |
56.7% |
40.4% |
+0.040 |
白金 |
47.6% |
52.4% |
50.0% |
45.4% |
−0.065 |
ゴム |
50.8% |
53.7% |
54.7% |
47.3% |
+0.022 |
商品別の最重要特徴量(上位5位)¶
商品 |
1位 |
2位 |
3位 |
4位 |
5位 |
|---|---|---|---|---|---|
金 |
rate_hike (0.29) |
n_percentages (0.26) |
n_price_levels (0.19) |
quant_density_bullish (0.11) |
quant_density_bearish (0.10) |
原油 |
rate_hike (0.53) |
quant_density_bearish (0.40) |
fomc (0.15) |
rate_cut (0.13) |
geopolitical (0.11) |
白金 |
employment (0.41) |
cpi (0.32) |
n_percentages (0.10) |
n_price_levels (0.09) |
rate_hike (0.08) |
ゴム |
n_moving_averages (1.77) |
rate_cut (0.28) |
quant_density_bullish (0.17) |
tariff (0.16) |
n_price_levels (0.15) |
太字は戦略4で新規追加された定量特徴量。
分析¶
定量特徴量がL1正則化を生き残った: 戦略3の交差項(event x sentiment)は全てゼロに圧縮されたが、定量特徴量と定量密度交差項は有意な係数を持つ。記事の「定量性」はイベント x センチメント方向よりも情報量が高い
ゴムの移動平均言及(1.77)が全商品・全特徴量中で最大の係数: ゴムはテクニカル分析が主導する市場であり、アナリストの移動平均線への言及密度がそのまま予測力に直結
原油の quant_density_bearish(0.40): bearish記事に数値情報が多い週の翌週に原油が下落する傾向。悲観的な見通しが具体的な数値で裏付けられている場合、その悲観の「質」が高い
金の n_percentages(0.26)と n_price_levels(0.19): 金は定量的議論の密度そのものが予測に寄与。パーセンテージや価格水準が多く言及される週は市場の注目度が高い
Accuracy は依然として baseline 未達: 定量特徴量は特徴量重要度で高い係数を持つが、予測精度の改善には至っていない。特徴量の「方向」(何が上がるか下がるか)ではなく「注目度」(市場がどれだけ注目しているか)を捉えている可能性
4戦略の総合比較¶
観点 |
戦略1 |
戦略2 |
戦略3 |
戦略4 |
|---|---|---|---|---|
手法 |
ルールベース |
TF-IDF + LR |
イベント検出 |
イベント + 定量抽出 |
金 Accuracy |
— |
57.2% |
61.7% |
60.7% |
ゴム Accuracy |
— |
47.6% |
47.0% |
50.8% |
原油 IC |
— |
−0.136 |
−0.075 |
+0.040 |
金の最重要特徴量 |
— |
— |
tariff |
rate_hike + n_percentages |
ゴムの最重要特徴量 |
— |
— |
rate_cut/tariff |
n_moving_averages |
交差項 |
— |
— |
全てゼロ |
bullish/bearish密度が活性化 |
次元数 |
2 |
2,000 |
34 |
20 |
主な成果 |
相関確認 |
ML限界の確認 |
感応構造の発見 |
定量性の予測価値を実証 |
結論¶
戦略4の最大の成果は、記事の「定量性」が予測に有用な特徴量であることの実証である。特に:
ゴム: テクニカル指標(移動平均線)への言及密度が最強の予測因子
原油: bearish記事の定量的裏付けの有無が予測を改善
金: パーセンテージと価格水準の言及密度が注目度の指標として機能
ただし、単独での予測精度は依然として baseline を超えておらず、テクニカル分析との統合が次の必須ステップである。
戦略5: 記事タイプ別モデル¶
前提条件¶
戦略3・4と同じデータ
記事タイプ分類ロジック
手法¶
14,078本の金融ニュース記事を7タイプに分類し、タイプ別のセンチメントスコアとoutlook記事に特化したイベント・定量特徴量を構築する。
記事タイプ分類(7種)¶
タイプ |
分類条件 |
本数 |
特性 |
|---|---|---|---|
outlook_dow |
タイトルに「短期見通し」+「ダウ」 |
1,767 |
最も予測的。方向性判断を明示 |
outlook_usdjpy |
タイトルに「短期見通し」+「ドル」 |
1,766 |
為替の方向性予測 |
analysis_dow |
タイトルに「論点解説」+「ダウ」 |
1,766 |
構造的分析。因果関係を整理 |
analysis_usdjpy |
タイトルに「論点解説」+「ドル」 |
1,767 |
同上 |
review_dow |
タイトルに「レビュー」+「ダウ」 |
1,705 |
事後的。前日結果の振り返り |
review_usdjpy |
タイトルに「レビュー」+「ドル」 |
1,706 |
同上 |
breaking_news |
上記以外(NY外為速報等) |
3,601 |
リアルタイムの短信 |
特徴量構成(29次元)¶
特徴量グループ |
次元数 |
説明 |
|---|---|---|
タイプ別センチメント |
4 |
outlook/analysis/review/breakingの各平均スコア |
タイプ別記事比率 |
4 |
各タイプの週内記事数比率 |
outlook特化イベント |
6 |
見通し記事内でのFOMC/利上げ/利下げ/関税/地政学/レジームシフト言及率 |
グローバルイベント |
9 |
全記事でのイベント言及率(戦略3と同一) |
定量パターン |
5 |
価格レンジ/SR/百分率/価格水準/移動平均(戦略4と同一) |
outlook定量密度 |
1 |
見通し記事の定量情報出現密度 |
実証結果¶
ウォークフォワード検証結果(n=313週、2020/01〜2026/02)¶
商品 |
Accuracy |
Baseline |
Bullish的中率 |
Bearish的中率 |
IC(Spearman) |
|---|---|---|---|---|---|
金 |
59.7% |
61.7% |
61.4% |
33.3% |
+0.005 |
原油 |
55.3% |
57.2% |
58.4% |
46.3% |
−0.079 |
白金 |
50.5% |
52.4% |
52.9% |
48.1% |
−0.040 |
ゴム |
50.8% |
53.7% |
54.9% |
47.4% |
+0.015 |
商品別の最重要特徴量(上位5位)¶
商品 |
1位 |
2位 |
3位 |
4位 |
5位 |
|---|---|---|---|---|---|
金 |
n_percentages (0.32) |
outlook_fomc (0.31) |
outlook_rate_hike (0.29) |
n_price_levels (0.21) |
rate_cut (0.17) |
原油 |
outlook_rate_hike (0.96) |
rate_cut (0.49) |
outlook_fomc (0.30) |
n_price_levels (0.23) |
analysis_sentiment (0.18) |
白金 |
outlook_geopolitical (0.48) |
employment (0.45) |
review_sentiment (0.37) |
analysis_sentiment (0.28) |
cpi (0.28) |
ゴム |
n_moving_averages (1.71) |
outlook_geopolitical (0.48) |
analysis_sentiment (0.44) |
rate_cut (0.30) |
n_price_levels (0.20) |
太字は戦略5で新規追加されたタイプ別特徴量。
分析¶
原油のoutlook_rate_hike(0.96)が全戦略・全特徴量中で最大の係数: 見通し記事で利上げが言及された週の翌週の原油方向予測に圧倒的な寄与。全記事混合の戦略4では rate_hike が 0.53 だったが、outlook記事に限定すると 0.96 に増大。見通し記事のシグナルが他記事タイプのノイズで希釈されていたことの直接的証拠
タイプ別センチメントがL1正則化を生き残った: analysis_sentiment(原油0.18、白金0.28、ゴム0.44)とreview_sentiment(白金0.37)が有意。混合センチメントでは消えていた予測力が記事タイプ分離で復活
白金のoutlook_geopolitical(0.48): 見通し記事での地政学言及が白金に最も影響。白金は南アフリカが主要産地であり、地政学リスクが供給リスクに直結
原油のBearish的中率46.3%が全戦略中で最高: bearish予測時の方向性精度が改善。タイプ別モデルはbearish判断の質を高めている
5戦略の総合比較¶
観点 |
戦略1 |
戦略2 |
戦略3 |
戦略4 |
戦略5 |
|---|---|---|---|---|---|
手法 |
ルールベース |
TF-IDF |
イベント検出 |
イベント+定量 |
タイプ別統合 |
金 Accuracy |
— |
57.2% |
61.7% |
60.7% |
59.7% |
原油 Bearish的中率 |
— |
34.8% |
37.5% |
40.4% |
46.3% |
白金 Accuracy |
— |
47.6% |
48.9% |
47.6% |
50.5% |
ゴム Accuracy |
— |
47.6% |
47.0% |
50.8% |
50.8% |
次元数 |
2 |
2,000 |
34 |
20 |
29 |
最重要発見 |
相関確認 |
ML限界 |
感応構造 |
定量性の価値 |
タイプ分離で係数増大 |
結論¶
戦略5の最大の成果は、記事タイプの分離がシグナル対ノイズ比を改善することの実証である:
outlook記事のイベント特徴量は混合の約2倍の係数: 見通し記事は最も予測的であり、レビューや速報のノイズから分離することで真の予測力が顕在化
analysis_sentimentとreview_sentimentの独立した予測力: 論点解説(構造的分析)とレビュー(事後評価)のセンチメントは、混合では相殺されていたが、分離すれば異なる情報を提供
原油のBearish的中率46.3%: ベースライン(42.8%)を上回るが、50%未満であり単独でのシグナルとしてはさらなる改善が必要。テクニカル分析との組み合わせによる精度向上が次の課題
戦略6: ゴールドレポート見通し分析¶
前提条件¶
NSN週間ゴールドレポート(バックナンバータイトル、約210号)
NSN週間ゴールドレポート全文(PDF→MD変換済み、209件、2022/02〜2026/03)
週足 OHLCV データ(GOLD)
NSNバックナンバー記事(戦略1と同一データ、戦略1のセンチメントとの比較用)
手法¶
ゴールドレポートのバックナンバータイトルおよび全文テキストから金市場の方向性見通しを抽出し、翌週の金価格リターンとの一致率を検証する。バックナンバー記事の一般的センチメント(戦略1)とは異なり、金市場に特化した専門レポートを分析対象とする。
データソース¶
ソース |
パス |
形式 |
件数 |
|---|---|---|---|
タイトル一覧(インデックス) |
|
◆/■パターンのタイトルテーブル |
~210件 |
全文レポート(PDF→MD) |
|
YAMLフロントマター + 本文 |
209件(2022/02〜2026/03) |
分析の5要素¶
レポートタイトルの方向性分類(ゴールド専用キーワード)
全文テキストの方向性分類(見通し本文 + 買い/売り材料リスト)(新規)
方向性 x 翌週リターンの一致率
バックナンバー記事センチメント(戦略1)との複合シグナル検証
TF-IDFによる予測力を持つ語彙の特定(タイトルのみ / 全文)
全文レポートの構造¶
各PDFレポート(rpGLD*.md)から以下のセクションを構造化抽出する:
タイトル: レポートの見出し(例: 「米利下げ観測後退が重石も地政学不安に支えられる」)
サブタイトル: NY金のレンジ予想(例: 「NY金4月限は5000〜5200ドルのレンジで高下か」)
見通し本文: 「■ 先週の動きと今週の見通し ■」セクション
▼売り材料▼: 弱気要因の箇条書きリスト
△買い材料△: 強気要因の箇条書きリスト
全文分類では、タイトルのキーワードスコアに加え、見通し本文のキーワード出現数と買い/売り材料の項目数を加算してスコアリングする。
ゴールド専用キーワード¶
バックナンバー記事の一般的キーワード(戦略1)とは別に、金市場レポート特有の語彙リストを使用する。
分類 |
キーワード例 |
|---|---|
Bullish |
底堅い、支えられる、高値圏を維持、逃避買い需要、高止まり、底意は強い、安全資産需要、根強い |
Bearish |
上値重い、利益確定、調整、軟調、重石、頭重い、低迷、上値を抑制、抑制される |
Neutral |
上記が拮抗、またはどちらにも該当しない |
定量情報抽出¶
全文レポートから nsn_sentiment_quantitative のパターン定数を再利用して定量特徴を抽出する:
価格レンジ表現(
PRICE_RANGE_PATTERN)サポート/レジスタンス水準(
SUPPORT_RESISTANCE_PATTERN)パーセンテージ(
PERCENTAGE_PATTERN)価格水準(
PRICE_LEVEL_PATTERN)テクニカル指標(
MOVING_AVERAGE_PATTERN)
TF-IDF語彙分析の設計¶
日本語テキストは空白区切りがないため、戦略2と同様に文字レベルn-gramを使用する。
パラメータ |
タイトルのみ |
全文 |
根拠 |
|---|---|---|---|
analyzer |
|
|
日本語は空白区切りがなく、文字レベルn-gramが有効 |
ngram_range |
(2, 4) |
(2, 4) |
2〜4文字のキーワード断片を捕捉 |
max_features |
200 |
500 |
全文は語彙が豊富なため増加 |
実際の翌週リターン方向(上昇/下落)でテキストを分割し、各方向に特徴的な語彙を抽出する。
統計的注意¶
約210エントリの週次データに基づく分析であり、戦略1〜5(313〜374週)と比較してサンプル数が少ない。信頼区間が広いため、方向性の参考として解釈すること。
検証結果¶
全文センチメント分析の予測精度を、day_bars 週足リターンデータで実証検証した結果を示す。
タイトルのみ vs 全文の比較¶
指標 |
タイトルのみ |
全文 |
|---|---|---|
相関係数 |
0.0184 |
0.1152 |
Bullish的中率 |
63.0% |
68.5% |
Bearish的中率 |
35.9% |
42.0% |
サンプル数 |
210 |
208 |
Bullish件数 |
108 |
108 |
Bearish件数 |
39 |
69 |
Neutral件数 |
63 |
31 |
全文分析では見通し本文と買い/売り材料リストの情報を加味するため、Neutral 判定が減少し、方向性のある分類が増加する。
FACTOR_WEIGHT 感度分析¶
買い/売り材料の項目数に乗じる重み FACTOR_WEIGHT を変動させた場合の的中率への影響:
FACTOR_WEIGHT |
相関係数 |
Bullish的中率 |
Bearish的中率 |
Bullish件数 |
Bearish件数 |
Neutral件数 |
|---|---|---|---|---|---|---|
0.5 |
0.1111 |
67.8% |
41.3% |
115 |
75 |
18 |
1.0 |
0.1152 |
68.5% |
42.0% |
108 |
69 |
31 |
2.0 |
0.0949 |
68.1% |
40.0% |
113 |
70 |
25 |
weight=1.0 が相関係数・Bullish的中率・Bearish的中率の全指標で最良であり、DEFAULT_FACTOR_WEIGHT = 1.0 を維持する。
TF-IDF語彙比較¶
指標 |
タイトルのみ |
全文 |
|---|---|---|
max_features |
200 |
500 |
抽出語彙数 |
60 |
60 |
代表的Bullish語彙 |
米、支え、観測、受け |
てい、いる、して、され |
代表的Bearish語彙 |
需要、買い、目先、受け |
てい、いる、して、する |
両手法とも char_wb analyzer(ngram_range=(2,4))を使用しているため、機能語的な部分文字列が上位を占める。タイトル版は短いテキストのため「支え」「需要」「観測」等の内容語が相対的に目立つが、全文版は本文の助詞・助動詞パターンが支配的となっている。形態素解析ベースのトークナイザ導入が改善の方向性として考えられる(→ 改良の方向性 方向3)。
定量情報とリターンの相関(Spearman順位相関)¶
extract_gold_report_quant_info() で抽出した各定量特徴量と翌週GOLDリターンのSpearman相関:
特徴量 |
Spearman相関 |
解釈 |
|---|---|---|
n_price_ranges |
-0.0422 |
価格レンジ表現の出現数 |
n_support_resistance |
-0.1112 |
サポート/レジスタンス言及数 |
n_percentages |
-0.1175 |
パーセンテージ表現数 |
n_price_levels |
+0.0615 |
価格水準言及数 |
n_moving_averages |
-0.0181 |
移動平均線言及数 |
total_quant_count |
-0.1353 |
全定量特徴の合計 |
多くの特徴量で弱い負の相関(-0.02〜-0.14)が見られるが、n_price_levels のみ弱い正の相関(+0.06)を示す。定量表現が多いレポートは市場の不確実性が高い局面で発行される傾向があり、翌週リターンがやや低下する可能性を示唆するが、相関の絶対値は小さく単独での予測力は限定的である(n=208)。
改良の方向性¶
方向1: 既存テクニカル特徴量との統合¶
定量的・機械学習アプローチ の特徴量リストにセンチメント特徴量を追加する:
テキストセンチメント(タイプ別週次集約スコア)をテクニカル指標と並列の入力変数として扱う
イベント特徴量(商品別感応構造 + outlook特化)をフィルタ条件として活用
LightGBM 等のアンサンブルモデルで特徴量重要度を評価する
ウォークフォワード検証で追加的予測力(incremental predictive power)を測定する
方向2: 週次 + 月次のカスケード構造¶
月次モデル: 月内の全記事(~160本/月)からセンチメントを集約 → マクロレジーム判定
週次モデル: 週内の記事(~40本/週)からタイプ別特徴量 → エントリータイミング判定
方向3: LLMベースのセンチメント分類¶
ルールベースのキーワード分類をLLM(Claude等)に置き換え
記事の文脈理解に基づく、より精緻なセンチメント分類
「利下げ期待」と「利下げ見送り」の区別など、ルールベースでは不可能な文脈判断
適用商品¶
商品 |
適合度 |
主要特徴量 |
備考 |
|---|---|---|---|
金 |
高 |
outlook_fomc, n_percentages |
Dow Bullish的中率63.8%(戦略1)+ outlook特化で係数増大 |
原油 |
高 |
outlook_rate_hike, rate_cut |
Bearish的中率46.3%(戦略5)、FOMC/金利政策感応 |
ゴム |
高 |
n_moving_averages, analysis_sentiment |
テクニカル主導市場 + 論点解説センチメントの独立予測力 |
白金 |
中 |
outlook_geopolitical, employment |
地政学リスク + 雇用統計感応(戦略5で改善) |
データ参照¶
記事パース・センチメント分類:
src/market_analysis/nsn_sentiment.pyTF-IDF モデル:
src/market_analysis/nsn_sentiment_tfidf.pyイベント検出モデル:
src/market_analysis/nsn_sentiment_event.py定量情報抽出モデル:
src/market_analysis/nsn_sentiment_quantitative.py記事タイプ別モデル:
src/market_analysis/nsn_sentiment_by_type.pyゴールドレポート見通し分析(タイトル + 全文):
src/market_analysis/gold_report_outlook.pyテスト(ゴールドレポート全文):
tests/test_gold_report_fulltext.pyテスト(ベースライン):
tests/test_nsn_sentiment_baseline.pyテスト(TF-IDF):
tests/test_nsn_sentiment_tfidf.pyテスト(イベント検出):
tests/test_nsn_sentiment_event.pyテスト(定量情報抽出):
tests/test_nsn_sentiment_quantitative.pyテスト(記事タイプ別):
tests/test_nsn_sentiment_by_type.pyテスト(ゴールドレポート):
tests/test_gold_report_outlook.pyテスト(ゴールドレポート検証):
tests/test_gold_report_validation.py週足 OHLCV:
compute_weekly_returns(_load_day_bars_view+interval_type = 'week')記事データ:
nsn_data/news/overseas_financial_news_backnumber/articles/、nsn_data/news/financial/forex_backnumber/articles/ゴールドレポートデータ(インデックス):
nsn_data/reports/gold_report/ゴールドレポートデータ(全文PDF→MD):
nsn_data/reports/gold_report/pdfs/
参考文献¶
[1] Loughran, T. and McDonald, B. (2011). “When is a Liability Not a Liability? Textual Analysis, Dictionaries, and 10-Ks.” The Journal of Finance, 66(1), 35-65. https://doi.org/10.1111/j.1540-6261.2010.01625.x
[2] Tetlock, P.C. (2007). “Giving Content to Investor Sentiment: The Role of Media in the Stock Market.” The Journal of Finance, 62(3), 1139-1168. https://doi.org/10.1111/j.1540-6261.2007.01232.x
[3] Ke, Z.T., Kelly, B.T. and Xiu, D. (2019). “Predicting Returns with Text Data.” NBER Working Paper No. 26186. https://www.nber.org/papers/w26186