NSNテキストセンチメント分析

概要

NSN(ミンカブ・ジ・インフォノイド)が提供する金融ニュース・為替市況のバックナンバーテキストから、キーワードベースのセンチメント指標を構築し、商品先物の週次リターン予測への活用可能性を検証した。テキストデータからの投資シグナル構築は先行研究でも検討されている [2][3]。7年分(2019年1月〜2026年2月)の約17,800本の記事を対象とし、ルールベースのベースラインモデルで相関分析を実施した。

データソース

NSNバックナンバー

NSNサイトから定期クロールで取得した3カテゴリのバックナンバー記事を使用する。

カテゴリ

記事数

サイズ

期間

内容

金融ニュース

14,078

18MB

2019/01〜2026/02

マーケットエッジ分析(短期見通し・論点解説・レビュー)、NY外国為替速報

為替市況

1,853

6.6MB

2019/01〜2026/03

NY為替市場概況(日次)

株式市況

1,853

9.1MB

2019/01〜2026/03

NY株式市場概況(日次)

データ格納場所: nsn_data/news/overseas_financial_news_backnumber/articles/nsn_data/news/financial/forex_backnumber/articles/nsn_data/news/financial/stock_backnumber/articles/

記事の構造

各ファイルは月単位(例: afk2510.md)で、 区切りで複数の日次記事を含む。金融ニュースの記事は以下の6タイプに分類される:

記事タイプ

本数

時間帯

内容

短期見通しダウ平均

~1,766

11:00頃

ダウ平均の方向性予測(最も前向き)

短期見通しドル円

~1,767

11:00頃

ドル円の方向性予測(最も前向き)

論点解説ダウ平均

~1,736

11:00頃

当日の注目材料の構造的分析

論点解説ドル円

~1,764

11:00頃

同上

レビューダウ平均

~1,569

08:00頃

前日NY市場の事後レビュー

レビュードル円

~1,706

08:00頃

同上

執筆: マーケットエッジ・小菅努氏(全記事共通)

ゴールドレポート

NSNが週次で発行する金市場の専門レポート。バックナンバーのタイトルに方向性見通しが凝縮されている。

項目

内容

発行頻度

週1回(土曜日付)

データ期間

2022/02〜2026/03(約210号)

形式

Markdown テーブル(タイトル + PDF リンク)

タイトル例

「米利下げ観測後退が重石も地政学不安に支えられる」

データ格納場所: nsn_data/reports/gold_report/

価格データ

足種

期間

サンプル数

記事との重複

週足

2018/07〜2026/03

400週

374週(2019/01〜)

月足

1992/12〜2026/03

295〜400月

86ヶ月(2019/01〜)

日足

2024/07〜2026/03

400日

400日

データ参照: day_bars Parquet(interval_type = 'week'

戦略1: ルールベース・センチメント指標(ベースライン)

前提条件

  • NSNバックナンバー記事(金融ニュース + 為替市況)

  • 週足 OHLCV データ

実装手順

  1. 記事を 区切りでパースし、日付・タイトル・本文を抽出する

  2. タイトルと本文中のキーワード出現頻度でセンチメントを分類する。辞書ベースのテキスト分類手法は Loughran and McDonald [1] のアプローチに基づく:

分類

キーワード例

Bullish

押し目買い、堅調、底固、リスクオン、買い優勢、一段高、反発、利下げ期待

Bearish

上値重い、軟調、弱気、リスクオフ、急落、下値不安、パニック、全面安、米国売り、キャリー解消

Neutral

上記いずれにも該当しない、または強弱が拮抗

  1. ISO 週単位でセンチメントスコアを集約する(週内記事の平均値)

  2. 翌週の商品先物リターンとの相関を計算する

パラメータ

パラメータ

根拠

最小記事数/週

3(金融ニュース)、2(為替市況)

ノイズ抑制

Bullish 閾値

週平均スコア > +0.1

弱いシグナルの除外

Bearish 閾値

週平均スコア < −0.1

同上

実証結果

センチメント分布

14,078本の金融ニュース記事の分類結果:

分類

記事数

比率

Bullish

4,843

34.4%

Neutral

5,775

41.0%

Bearish

3,460

24.6%

Dow見通しセンチメント → 商品先物翌週リターン(n=362週、2019/01〜2026/02)

商品

相関係数

Bullish的中率

Bearish的中率

Bullish平均リターン

Bearish平均リターン

+0.048

63.8%

42.3%

+0.507%/週

+0.413%/週

原油

+0.038

57.7%

47.1%

+0.233%/週

−0.138%/週

白金

+0.026

52.6%

48.1%

+0.503%/週

+0.199%/週

ゴム

+0.100

54.9%

51.9%

+0.306%/週

−0.333%/週

USD/JPY見通しセンチメント → 商品先物翌週リターン(n=362週)

商品

相関係数

備考

−0.046

ドル円弱気(円高)時に金が上昇する傾向

原油

−0.059

同上

白金

−0.059

同上

ゴム

−0.054

同上

為替市況記事センチメント → 商品先物翌週リターン(n=373週)

商品

相関係数

Bullish的中率

Bearish的中率

Bullish平均リターン

Bearish平均リターン

+0.011

64.3%

40.4%

+0.534%/週

+0.454%/週

原油

−0.111

53.6%

36.0%

−0.021%/週

+0.677%/週

白金

−0.009

53.6%

50.0%

+0.550%/週

+0.601%/週

ゴム

+0.031

52.6%

45.6%

+0.414%/週

−0.071%/週

主要な発見

  1. 金のDow Bullish的中率 63.8%: Dow見通しが強気の週、翌週の金は63.8%の確率で上昇した。リスクオン環境で金も買われる「リスクオン + インフレヘッジ」の複合効果を反映している

  2. ゴムのDow相関 +0.100: 全組合せ中最大。ゴムは景気敏感商品であり、株式市場のセンチメントが直接波及する合理的な関係

  3. 原油のドル円逆相関 −0.111: ドル円が強気(円安)と報じられた翌週に原油が下落する傾向。ドル高が原油安を促すメカニズムを反映している可能性がある

  4. USD/JPY見通しと全商品の逆相関: ドル円弱気(円高方向)のセンチメントが翌週の商品価格上昇と相関する一貫した傾向が全4商品で確認された

評価

観点

評価

単独での予測力

弱い(相関係数 0.03〜0.11)。単体の売買シグナルとしては不十分

補助シグナルとしての価値

あり。特に金のDow Bullish的中率 63.8%、ゴムのDow相関 +0.10 は既存テクニカル戦略の補助フィルタとして有用

改良の余地

大きい。ルールベースは粗い Bag-of-Words であり、改良の方向性が複数存在する(後述)

主要イベント期の記事先行性検証

5つの主要相場変動期について、記事内容と価格データを照合し、先行性を検証した。

コロナショック + 原油暴落(2020年3月)

金: 週間 −6.44%、原油: 週間 −21.12%

  • 3/12の記事で「金に続いて米国債など安全資産も売却されている」「1998年のLTCM危機と類似」と構造的分析を提示。全資産同時暴落の背景を理解する先行的洞察

  • キャッシュ化」という概念の提示は、その後の流動性危機深化を示唆

日銀利上げショック(2024年8月5日)

金: −6.34%、原油: −9.54%

  • 8/6の記事で「円キャリートレード解消は JPモルガンは60%程度、UBSは50%程度の完了状態」と定量的な先行情報を提供。追加下落リスクの定量的評価であり、ポジションサイジングに直結

  • 8/7の記事で日銀・内田副総裁の会見に注目を促し、翌日のハト派発言による円高反転を事前に示唆

高市トレード → 金急騰(2025年9月末〜10月)

金: 5週間で +25.92%

  • 10/7の記事で「財政赤字・公的債務の拡大」「高市氏は財政規律を重視する声明を出さざるを得なくなる可能性が高い」と反転条件を事前に特定

  • 10/8の記事で「チャート上は155円まで抵抗線が見当たらない」と上値目処を提示

トランプ関税ショック(2025年4月)

原油: 4/7に −8.30%、4/10に +6.62%

  • 4/10の記事で「米長期国債売り、ドル売り、米国株売りと、米資産は全面安」というフレーミングを提示。従来の「リスクオフ → 米国債買い → ドル高」が崩れたパラダイムシフトの先行認識

  • 「債券市場は非常に厄介だ」というトランプ発言から、関税停止の真の動機を分析

金の急騰→暴落(2026年1月29日〜2月2日)

1/29: +6.55%、2/2: −15.00%

  • 1/30の記事で「FRB次期議長にウォーシュ元FRB理事を指名」「タカ派色が最も強い」と分析。金 −15% 暴落の最大のトリガー要因を事前に特定

先行性の総合評価

評価軸

結果

先行性

あり(条件付き)。直接的な価格予測ではないが、反転条件・構造要因・上値/下値目処の提示に先行性がある

投資判断への有用性

高い。特にポジションの方向性判断、リスク管理の強化/緩和判断、マーケットレジームの変化認識に有用

最も先行性の高い記事タイプ

「短期見通し」(方向性予測)、「論点解説」(構造的理解)

限界

「先行シグナル」というよりは「判断材料の整理と構造化」。定量シグナルとしてそのまま使うのは難しい

戦略2: TF-IDF + ロジスティック回帰(ML改良)

前提条件

  • 戦略1と同じデータ(NSNバックナンバー記事 + 週足 OHLCV)

  • scikit-learn(TfidfVectorizer, LogisticRegression)

手法

ルールベースの固定キーワードリストを排し、TF-IDFベクトル化で記事テキスト全体から統計的に重要な語彙を自動抽出する。

  1. 週内の全記事テキスト(タイトル + 本文)を結合

  2. 文字レベル n-gram(2〜4文字、char_wb)で TF-IDF ベクトル化(最大2,000特徴量)

  3. L1正則化ロジスティック回帰(C=0.1)で翌週リターンの方向(上昇/下落)を分類

  4. ウォークフォワード検証: 最低52週の訓練窓から開始し、1週ずつ前進

パラメータ選択の根拠

パラメータ

根拠

analyzer

char_wb

日本語は空白区切りがなく、形態素解析器への依存を回避。文字レベル n-gram が有効

ngram_range

(2, 4)

「利下げ」「急落」等の2〜4文字キーワードを捕捉

max_features

2,000

高次元スパース特徴量のオーバーフィット抑制

C(正則化強度)

0.1

強めの正則化。サンプル数(~300週)に対して特徴量が多いため

L1正則化

l1_ratio=1.0

スパース解を促進し、重要な語彙を自動選択

min_train_weeks

52

最低1年の学習データを確保

実証結果

ウォークフォワード検証結果(n=313週、2020/01〜2026/02)

商品

Accuracy

Baseline

Bullish的中率

Bearish的中率

IC(Spearman)

57.2%

61.7%

62.1%

40.0%

+0.011

原油

50.8%

57.2%

55.1%

34.8%

−0.136

白金

47.6%

52.4%

0.0%

47.6%

+0.000

ゴム

47.6%

53.7%

70.0%

46.9%

+0.057

Baseline: 多数派クラス(常に上昇と予測)の精度

分析

  1. Baseline Accuracy を超える商品がない: 全商品でモデル精度が多数派予測を下回った。TF-IDF char n-gram だけでは、ルールベースのキーワード分類と同等以上の予測力を得られなかった

  2. 金の Bullish 的中率 62.1%: 戦略1(63.8%)と同水準。テキストから「上昇シグナル」を検出する能力は維持されている

  3. ゴムの Bullish 的中率 70.0%: 予測が bullish と判定された場合の方向性は高いが、bullish 予測自体が少ない

  4. 白金の Bullish 予測ゼロ: モデルが保守的すぎて常に bearish を予測。L1 正則化が強すぎる可能性

  5. IC(情報係数)が極めて低い: 予測確率とリターンの順位相関がほぼゼロ。確率値自体に信頼性がない

考察: なぜ ML が改善しなかったか

要因

説明

特徴量の質

char n-gram は語彙の意味を捉えられない。「利下げ期待」と「利下げ見送り」が類似特徴量になる

サンプル数不足

313週 × 2,000特徴量は典型的な「次元の呪い」。L1正則化だけでは不十分

ラベルの非定常性

テキスト→価格の関係が時間とともに変化。固定モデルでは追従できない

記事タイプ混在

見通し記事とレビュー記事の特性が異なるが、同一特徴量空間に混在している

戦略1 vs 戦略2 比較

観点

戦略1(ルールベース)

戦略2(TF-IDF + LR)

金 Bullish 的中率

63.8%

62.1%

ゴム相関/IC

+0.100

+0.057

解釈可能性

高(キーワード明示)

低(2,000次元ベクトル)

運用コスト

高(モデル再学習が必要)

結論

現時点では戦略1が優位

特徴量の質的改善が前提

戦略3: イベント検出型特徴量 + センチメント交差項

前提条件

  • 戦略1と同じデータ(NSNバックナンバー記事 + 週足 OHLCV)

  • scikit-learn(LogisticRegression)

手法

ドメイン知識に基づく11カテゴリのマクロイベントを記事から検出し、センチメント方向との交差項を含む構造化特徴量で予測する。

イベントカテゴリ(11種)

カテゴリ

キーワード例

記事出現率

fomc

FOMC、FRB、パウエル、連邦準備

35.1%

rate_hike

利上げ、タカ派、引き締め

21.7%

rate_cut

利下げ、ハト派、緩和的

18.0%

employment

雇用統計、失業率

12.6%

cpi

CPI、消費者物価、インフレ率

11.2%

boj

日銀、植田、内田副総裁

8.8%

ecb

ECB、ラガルド

8.1%

geopolitical

イラン、ウクライナ、中東、制裁

6.2%

tariff

関税、貿易摩擦

6.1%

regime_shift

パニック、米国売り、暴落、全面安

3.9%

gdp

GDP、リセッション

3.9%

特徴量構成(34次元)

特徴量グループ

次元数

説明

ベースイベント頻度

11

週内記事でのイベント言及率(0〜1)

センチメントスコア

1

戦略1ルールベースの平均スコア

交差項(event x bullish)

11

イベント言及 かつ bullish 記事の割合

交差項(event x bearish)

11

イベント言及 かつ bearish 記事の割合

交差項の設計意図: 「FOMC言及 + bearish」(利上げ懸念局面)と「地政学 + bearish」(紛争リスク局面)では商品への影響メカニズムが異なる。イベントの「文脈」をモデルに提供する。

実証結果

ウォークフォワード検証結果(n=313週、2020/01〜2026/02)

商品

Accuracy

Baseline

Bullish的中率

Bearish的中率

IC(Spearman)

61.7%

61.7%

61.7%

0.0%

−0.080

原油

55.3%

57.2%

56.8%

37.5%

−0.075

白金

48.9%

52.4%

51.3%

46.6%

−0.038

ゴム

47.0%

53.7%

50.5%

40.9%

−0.083

商品別の最重要特徴量(上位5位)

商品

1位

2位

3位

4位

5位

tariff (0.075)

fomc (0.046)

sentiment (0.037)

rate_cut (0.031)

rate_hike (0.029)

原油

rate_cut (0.393)

fomc (0.389)

rate_hike (0.380)

sentiment (0.201)

geopolitical (0.108)

白金

employment (0.409)

cpi (0.233)

rate_hike (0.055)

geopolitical (0.016)

fomc (0.004)

ゴム

rate_cut (0.186)

tariff (0.182)

fomc (0.038)

geopolitical (0.035)

sentiment (0.034)

分析

  1. 交差項はL1正則化で完全に抑制された: 313サンプルに対して34特徴量は過剰。交差項22個はすべて係数ゼロに圧縮され、ベースイベント頻度11個 + sentiment_scoreのみがモデルに寄与

  2. 金のモデルは事実上「常にbullish予測」: accuracy = baseline = 61.7%。金が上昇基調の期間が長いため、モデルが多数派予測に収束

  3. 商品別の特徴量プロファイルに差異:

    • 原油: 金融政策三要素(FOMC・利上げ・利下げ)が支配的(係数0.38〜0.39)。金融政策経由の需要見通しが原油価格を左右

    • 白金: 雇用統計(0.41)とCPI(0.23)が突出。実体経済指標への感応度が最も高い

    • ゴム: 利下げ(0.19)と関税(0.18)の二大要因。景気敏感商品+貿易政策リスクの特性

    • : tariff(0.075)が最重要だが係数は小さい。テキスト情報だけでは金価格の予測が困難

3戦略の総合比較

観点

戦略1(ルールベース)

戦略2(TF-IDF)

戦略3(イベント検出)

金 Accuracy

57.2%

61.7%

金 Bullish 的中率

63.8%

62.1%

61.7%

原油 最重要特徴量

FOMC/利上げ/利下げ

解釈可能性

高(イベント名が明示)

次元数

2(bull/bear)

2,000

34(有効12)

主な知見

方向性の相関確認

ML単独では不十分

商品別の感応構造を可視化

結論

イベント検出モデルの最大の成果は予測精度ではなく、商品ごとのイベント感応構造の発見である。原油がFOMC/金利政策に、白金が雇用統計/CPIに、ゴムが利下げ/関税に最も反応するという構造的知見は、テクニカル分析との組み合わせにおいてフィルタリング条件として活用できる。

戦略4: 定量情報抽出 + イベント統合モデル

前提条件

  • 戦略3と同じデータ(NSNバックナンバー記事 + 週足 OHLCV)

  • scikit-learn(LogisticRegression)

手法

記事中の数値パターン(価格レンジ、サポート/レジスタンス、パーセンテージ、価格水準、移動平均線言及)を正規表現で抽出し、戦略3のイベント特徴量と統合する。

定量パターン(5種)と出現率

パターン

正規表現の対象

記事出現率

価格レンジ

「108〜109円」「2万0000〜2万1000ドル」

10.8%

サポート/レジスタンス

「支持線」「抵抗線」「サポート」「レジスタンス」

16.5%

パーセンテージ

「1.5%」「0.8%上昇」

39.1%

価格水準

「2万5000ドル水準」「110円台」「107.50円付近」

52.4%

移動平均線

「21日線」「200日線」「移動平均」

特徴量構成(20次元)

特徴量グループ

次元数

説明

イベント頻度(戦略3)

11

FOMC、雇用統計、CPI等の週内言及率

センチメントスコア

1

戦略1ルールベースの平均値

定量パターン

5

価格レンジ/SR/百分率/価格水準/移動平均の週内平均出現数

定量密度 x bullish

1

bullish記事内の定量パターン総出現数

定量密度 x bearish

1

bearish記事内の定量パターン総出現数

テクニカル意識度

1

サポート/レジスタンス + 移動平均線の合計言及数

交差項の設計意図

  • quant_density_bullish/bearish: センチメントの「確信度」の代理変数。bullish記事に数値情報が多い場合、アナリストが定量的根拠を持って強気と判断していることを示唆

  • tech_awareness: テクニカル分析的な記事の密度。価格目処やチャートへの言及が多い週はテクニカル主導の相場

実証結果

ウォークフォワード検証結果(n=313週、2020/01〜2026/02)

商品

Accuracy

Baseline

Bullish的中率

Bearish的中率

IC(Spearman)

60.7%

61.7%

61.4%

20.0%

+0.000

原油

54.0%

57.2%

56.7%

40.4%

+0.040

白金

47.6%

52.4%

50.0%

45.4%

−0.065

ゴム

50.8%

53.7%

54.7%

47.3%

+0.022

商品別の最重要特徴量(上位5位)

商品

1位

2位

3位

4位

5位

rate_hike (0.29)

n_percentages (0.26)

n_price_levels (0.19)

quant_density_bullish (0.11)

quant_density_bearish (0.10)

原油

rate_hike (0.53)

quant_density_bearish (0.40)

fomc (0.15)

rate_cut (0.13)

geopolitical (0.11)

白金

employment (0.41)

cpi (0.32)

n_percentages (0.10)

n_price_levels (0.09)

rate_hike (0.08)

ゴム

n_moving_averages (1.77)

rate_cut (0.28)

quant_density_bullish (0.17)

tariff (0.16)

n_price_levels (0.15)

太字は戦略4で新規追加された定量特徴量。

分析

  1. 定量特徴量がL1正則化を生き残った: 戦略3の交差項(event x sentiment)は全てゼロに圧縮されたが、定量特徴量と定量密度交差項は有意な係数を持つ。記事の「定量性」はイベント x センチメント方向よりも情報量が高い

  2. ゴムの移動平均言及(1.77)が全商品・全特徴量中で最大の係数: ゴムはテクニカル分析が主導する市場であり、アナリストの移動平均線への言及密度がそのまま予測力に直結

  3. 原油の quant_density_bearish(0.40): bearish記事に数値情報が多い週の翌週に原油が下落する傾向。悲観的な見通しが具体的な数値で裏付けられている場合、その悲観の「質」が高い

  4. 金の n_percentages(0.26)と n_price_levels(0.19): 金は定量的議論の密度そのものが予測に寄与。パーセンテージや価格水準が多く言及される週は市場の注目度が高い

  5. Accuracy は依然として baseline 未達: 定量特徴量は特徴量重要度で高い係数を持つが、予測精度の改善には至っていない。特徴量の「方向」(何が上がるか下がるか)ではなく「注目度」(市場がどれだけ注目しているか)を捉えている可能性

4戦略の総合比較

観点

戦略1

戦略2

戦略3

戦略4

手法

ルールベース

TF-IDF + LR

イベント検出

イベント + 定量抽出

金 Accuracy

57.2%

61.7%

60.7%

ゴム Accuracy

47.6%

47.0%

50.8%

原油 IC

−0.136

−0.075

+0.040

金の最重要特徴量

tariff

rate_hike + n_percentages

ゴムの最重要特徴量

rate_cut/tariff

n_moving_averages

交差項

全てゼロ

bullish/bearish密度が活性化

次元数

2

2,000

34

20

主な成果

相関確認

ML限界の確認

感応構造の発見

定量性の予測価値を実証

結論

戦略4の最大の成果は、記事の「定量性」が予測に有用な特徴量であることの実証である。特に:

  • ゴム: テクニカル指標(移動平均線)への言及密度が最強の予測因子

  • 原油: bearish記事の定量的裏付けの有無が予測を改善

  • : パーセンテージと価格水準の言及密度が注目度の指標として機能

ただし、単独での予測精度は依然として baseline を超えておらず、テクニカル分析との統合が次の必須ステップである。

戦略5: 記事タイプ別モデル

前提条件

  • 戦略3・4と同じデータ

  • 記事タイプ分類ロジック

手法

14,078本の金融ニュース記事を7タイプに分類し、タイプ別のセンチメントスコアとoutlook記事に特化したイベント・定量特徴量を構築する。

記事タイプ分類(7種)

タイプ

分類条件

本数

特性

outlook_dow

タイトルに「短期見通し」+「ダウ」

1,767

最も予測的。方向性判断を明示

outlook_usdjpy

タイトルに「短期見通し」+「ドル」

1,766

為替の方向性予測

analysis_dow

タイトルに「論点解説」+「ダウ」

1,766

構造的分析。因果関係を整理

analysis_usdjpy

タイトルに「論点解説」+「ドル」

1,767

同上

review_dow

タイトルに「レビュー」+「ダウ」

1,705

事後的。前日結果の振り返り

review_usdjpy

タイトルに「レビュー」+「ドル」

1,706

同上

breaking_news

上記以外(NY外為速報等)

3,601

リアルタイムの短信

特徴量構成(29次元)

特徴量グループ

次元数

説明

タイプ別センチメント

4

outlook/analysis/review/breakingの各平均スコア

タイプ別記事比率

4

各タイプの週内記事数比率

outlook特化イベント

6

見通し記事内でのFOMC/利上げ/利下げ/関税/地政学/レジームシフト言及率

グローバルイベント

9

全記事でのイベント言及率(戦略3と同一)

定量パターン

5

価格レンジ/SR/百分率/価格水準/移動平均(戦略4と同一)

outlook定量密度

1

見通し記事の定量情報出現密度

実証結果

ウォークフォワード検証結果(n=313週、2020/01〜2026/02)

商品

Accuracy

Baseline

Bullish的中率

Bearish的中率

IC(Spearman)

59.7%

61.7%

61.4%

33.3%

+0.005

原油

55.3%

57.2%

58.4%

46.3%

−0.079

白金

50.5%

52.4%

52.9%

48.1%

−0.040

ゴム

50.8%

53.7%

54.9%

47.4%

+0.015

商品別の最重要特徴量(上位5位)

商品

1位

2位

3位

4位

5位

n_percentages (0.32)

outlook_fomc (0.31)

outlook_rate_hike (0.29)

n_price_levels (0.21)

rate_cut (0.17)

原油

outlook_rate_hike (0.96)

rate_cut (0.49)

outlook_fomc (0.30)

n_price_levels (0.23)

analysis_sentiment (0.18)

白金

outlook_geopolitical (0.48)

employment (0.45)

review_sentiment (0.37)

analysis_sentiment (0.28)

cpi (0.28)

ゴム

n_moving_averages (1.71)

outlook_geopolitical (0.48)

analysis_sentiment (0.44)

rate_cut (0.30)

n_price_levels (0.20)

太字は戦略5で新規追加されたタイプ別特徴量。

分析

  1. 原油のoutlook_rate_hike(0.96)が全戦略・全特徴量中で最大の係数: 見通し記事で利上げが言及された週の翌週の原油方向予測に圧倒的な寄与。全記事混合の戦略4では rate_hike が 0.53 だったが、outlook記事に限定すると 0.96 に増大。見通し記事のシグナルが他記事タイプのノイズで希釈されていたことの直接的証拠

  2. タイプ別センチメントがL1正則化を生き残った: analysis_sentiment(原油0.18、白金0.28、ゴム0.44)とreview_sentiment(白金0.37)が有意。混合センチメントでは消えていた予測力が記事タイプ分離で復活

  3. 白金のoutlook_geopolitical(0.48): 見通し記事での地政学言及が白金に最も影響。白金は南アフリカが主要産地であり、地政学リスクが供給リスクに直結

  4. 原油のBearish的中率46.3%が全戦略中で最高: bearish予測時の方向性精度が改善。タイプ別モデルはbearish判断の質を高めている

5戦略の総合比較

観点

戦略1

戦略2

戦略3

戦略4

戦略5

手法

ルールベース

TF-IDF

イベント検出

イベント+定量

タイプ別統合

金 Accuracy

57.2%

61.7%

60.7%

59.7%

原油 Bearish的中率

34.8%

37.5%

40.4%

46.3%

白金 Accuracy

47.6%

48.9%

47.6%

50.5%

ゴム Accuracy

47.6%

47.0%

50.8%

50.8%

次元数

2

2,000

34

20

29

最重要発見

相関確認

ML限界

感応構造

定量性の価値

タイプ分離で係数増大

結論

戦略5の最大の成果は、記事タイプの分離がシグナル対ノイズ比を改善することの実証である:

  1. outlook記事のイベント特徴量は混合の約2倍の係数: 見通し記事は最も予測的であり、レビューや速報のノイズから分離することで真の予測力が顕在化

  2. analysis_sentimentとreview_sentimentの独立した予測力: 論点解説(構造的分析)とレビュー(事後評価)のセンチメントは、混合では相殺されていたが、分離すれば異なる情報を提供

  3. 原油のBearish的中率46.3%: ベースライン(42.8%)を上回るが、50%未満であり単独でのシグナルとしてはさらなる改善が必要。テクニカル分析との組み合わせによる精度向上が次の課題

戦略6: ゴールドレポート見通し分析

前提条件

  • NSN週間ゴールドレポート(バックナンバータイトル、約210号)

  • NSN週間ゴールドレポート全文(PDF→MD変換済み、209件、2022/02〜2026/03)

  • 週足 OHLCV データ(GOLD)

  • NSNバックナンバー記事(戦略1と同一データ、戦略1のセンチメントとの比較用)

手法

ゴールドレポートのバックナンバータイトルおよび全文テキストから金市場の方向性見通しを抽出し、翌週の金価格リターンとの一致率を検証する。バックナンバー記事の一般的センチメント(戦略1)とは異なり、金市場に特化した専門レポートを分析対象とする。

データソース

ソース

パス

形式

件数

タイトル一覧(インデックス)

nsn_data/reports/gold_report/2026-03-11.md

◆/■パターンのタイトルテーブル

~210件

全文レポート(PDF→MD)

nsn_data/reports/gold_report/pdfs/rpGLD*.md

YAMLフロントマター + 本文

209件(2022/02〜2026/03)

分析の5要素

  1. レポートタイトルの方向性分類(ゴールド専用キーワード)

  2. 全文テキストの方向性分類(見通し本文 + 買い/売り材料リスト)(新規)

  3. 方向性 x 翌週リターンの一致率

  4. バックナンバー記事センチメント(戦略1)との複合シグナル検証

  5. TF-IDFによる予測力を持つ語彙の特定(タイトルのみ / 全文)

全文レポートの構造

各PDFレポート(rpGLD*.md)から以下のセクションを構造化抽出する:

  • タイトル: レポートの見出し(例: 「米利下げ観測後退が重石も地政学不安に支えられる」)

  • サブタイトル: NY金のレンジ予想(例: 「NY金4月限は5000〜5200ドルのレンジで高下か」)

  • 見通し本文: 「■ 先週の動きと今週の見通し ■」セクション

  • ▼売り材料▼: 弱気要因の箇条書きリスト

  • △買い材料△: 強気要因の箇条書きリスト

全文分類では、タイトルのキーワードスコアに加え、見通し本文のキーワード出現数と買い/売り材料の項目数を加算してスコアリングする。

ゴールド専用キーワード

バックナンバー記事の一般的キーワード(戦略1)とは別に、金市場レポート特有の語彙リストを使用する。

分類

キーワード例

Bullish

底堅い、支えられる、高値圏を維持、逃避買い需要、高止まり、底意は強い、安全資産需要、根強い

Bearish

上値重い、利益確定、調整、軟調、重石、頭重い、低迷、上値を抑制、抑制される

Neutral

上記が拮抗、またはどちらにも該当しない

定量情報抽出

全文レポートから nsn_sentiment_quantitative のパターン定数を再利用して定量特徴を抽出する:

  • 価格レンジ表現(PRICE_RANGE_PATTERN

  • サポート/レジスタンス水準(SUPPORT_RESISTANCE_PATTERN

  • パーセンテージ(PERCENTAGE_PATTERN

  • 価格水準(PRICE_LEVEL_PATTERN

  • テクニカル指標(MOVING_AVERAGE_PATTERN

TF-IDF語彙分析の設計

日本語テキストは空白区切りがないため、戦略2と同様に文字レベルn-gramを使用する。

パラメータ

タイトルのみ

全文

根拠

analyzer

char_wb

char_wb

日本語は空白区切りがなく、文字レベルn-gramが有効

ngram_range

(2, 4)

(2, 4)

2〜4文字のキーワード断片を捕捉

max_features

200

500

全文は語彙が豊富なため増加

実際の翌週リターン方向(上昇/下落)でテキストを分割し、各方向に特徴的な語彙を抽出する。

統計的注意

約210エントリの週次データに基づく分析であり、戦略1〜5(313〜374週)と比較してサンプル数が少ない。信頼区間が広いため、方向性の参考として解釈すること。

検証結果

全文センチメント分析の予測精度を、day_bars 週足リターンデータで実証検証した結果を示す。

タイトルのみ vs 全文の比較

指標

タイトルのみ

全文

相関係数

0.0184

0.1152

Bullish的中率

63.0%

68.5%

Bearish的中率

35.9%

42.0%

サンプル数

210

208

Bullish件数

108

108

Bearish件数

39

69

Neutral件数

63

31

全文分析では見通し本文と買い/売り材料リストの情報を加味するため、Neutral 判定が減少し、方向性のある分類が増加する。

FACTOR_WEIGHT 感度分析

買い/売り材料の項目数に乗じる重み FACTOR_WEIGHT を変動させた場合の的中率への影響:

FACTOR_WEIGHT

相関係数

Bullish的中率

Bearish的中率

Bullish件数

Bearish件数

Neutral件数

0.5

0.1111

67.8%

41.3%

115

75

18

1.0

0.1152

68.5%

42.0%

108

69

31

2.0

0.0949

68.1%

40.0%

113

70

25

weight=1.0 が相関係数・Bullish的中率・Bearish的中率の全指標で最良であり、DEFAULT_FACTOR_WEIGHT = 1.0 を維持する。

TF-IDF語彙比較

指標

タイトルのみ

全文

max_features

200

500

抽出語彙数

60

60

代表的Bullish語彙

米、支え、観測、受け

てい、いる、して、され

代表的Bearish語彙

需要、買い、目先、受け

てい、いる、して、する

両手法とも char_wb analyzer(ngram_range=(2,4))を使用しているため、機能語的な部分文字列が上位を占める。タイトル版は短いテキストのため「支え」「需要」「観測」等の内容語が相対的に目立つが、全文版は本文の助詞・助動詞パターンが支配的となっている。形態素解析ベースのトークナイザ導入が改善の方向性として考えられる(→ 改良の方向性 方向3)。

定量情報とリターンの相関(Spearman順位相関)

extract_gold_report_quant_info() で抽出した各定量特徴量と翌週GOLDリターンのSpearman相関:

特徴量

Spearman相関

解釈

n_price_ranges

-0.0422

価格レンジ表現の出現数

n_support_resistance

-0.1112

サポート/レジスタンス言及数

n_percentages

-0.1175

パーセンテージ表現数

n_price_levels

+0.0615

価格水準言及数

n_moving_averages

-0.0181

移動平均線言及数

total_quant_count

-0.1353

全定量特徴の合計

多くの特徴量で弱い負の相関(-0.02〜-0.14)が見られるが、n_price_levels のみ弱い正の相関(+0.06)を示す。定量表現が多いレポートは市場の不確実性が高い局面で発行される傾向があり、翌週リターンがやや低下する可能性を示唆するが、相関の絶対値は小さく単独での予測力は限定的である(n=208)。

改良の方向性

方向1: 既存テクニカル特徴量との統合

定量的・機械学習アプローチ の特徴量リストにセンチメント特徴量を追加する:

  • テキストセンチメント(タイプ別週次集約スコア)をテクニカル指標と並列の入力変数として扱う

  • イベント特徴量(商品別感応構造 + outlook特化)をフィルタ条件として活用

  • LightGBM 等のアンサンブルモデルで特徴量重要度を評価する

  • ウォークフォワード検証で追加的予測力(incremental predictive power)を測定する

方向2: 週次 + 月次のカスケード構造

  • 月次モデル: 月内の全記事(~160本/月)からセンチメントを集約 → マクロレジーム判定

  • 週次モデル: 週内の記事(~40本/週)からタイプ別特徴量 → エントリータイミング判定

方向3: LLMベースのセンチメント分類

  • ルールベースのキーワード分類をLLM(Claude等)に置き換え

  • 記事の文脈理解に基づく、より精緻なセンチメント分類

  • 「利下げ期待」と「利下げ見送り」の区別など、ルールベースでは不可能な文脈判断

適用商品

商品

適合度

主要特徴量

備考

outlook_fomc, n_percentages

Dow Bullish的中率63.8%(戦略1)+ outlook特化で係数増大

原油

outlook_rate_hike, rate_cut

Bearish的中率46.3%(戦略5)、FOMC/金利政策感応

ゴム

n_moving_averages, analysis_sentiment

テクニカル主導市場 + 論点解説センチメントの独立予測力

白金

outlook_geopolitical, employment

地政学リスク + 雇用統計感応(戦略5で改善)

データ参照

  • 記事パース・センチメント分類: src/market_analysis/nsn_sentiment.py

  • TF-IDF モデル: src/market_analysis/nsn_sentiment_tfidf.py

  • イベント検出モデル: src/market_analysis/nsn_sentiment_event.py

  • 定量情報抽出モデル: src/market_analysis/nsn_sentiment_quantitative.py

  • 記事タイプ別モデル: src/market_analysis/nsn_sentiment_by_type.py

  • ゴールドレポート見通し分析(タイトル + 全文): src/market_analysis/gold_report_outlook.py

  • テスト(ゴールドレポート全文): tests/test_gold_report_fulltext.py

  • テスト(ベースライン): tests/test_nsn_sentiment_baseline.py

  • テスト(TF-IDF): tests/test_nsn_sentiment_tfidf.py

  • テスト(イベント検出): tests/test_nsn_sentiment_event.py

  • テスト(定量情報抽出): tests/test_nsn_sentiment_quantitative.py

  • テスト(記事タイプ別): tests/test_nsn_sentiment_by_type.py

  • テスト(ゴールドレポート): tests/test_gold_report_outlook.py

  • テスト(ゴールドレポート検証): tests/test_gold_report_validation.py

  • 週足 OHLCV: compute_weekly_returns_load_day_bars_view + interval_type = 'week'

  • 記事データ: nsn_data/news/overseas_financial_news_backnumber/articles/nsn_data/news/financial/forex_backnumber/articles/

  • ゴールドレポートデータ(インデックス): nsn_data/reports/gold_report/

  • ゴールドレポートデータ(全文PDF→MD): nsn_data/reports/gold_report/pdfs/

参考文献

  • [1] Loughran, T. and McDonald, B. (2011). “When is a Liability Not a Liability? Textual Analysis, Dictionaries, and 10-Ks.” The Journal of Finance, 66(1), 35-65. https://doi.org/10.1111/j.1540-6261.2010.01625.x

  • [2] Tetlock, P.C. (2007). “Giving Content to Investor Sentiment: The Role of Media in the Stock Market.” The Journal of Finance, 62(3), 1139-1168. https://doi.org/10.1111/j.1540-6261.2007.01232.x

  • [3] Ke, Z.T., Kelly, B.T. and Xiu, D. (2019). “Predicting Returns with Text Data.” NBER Working Paper No. 26186. https://www.nber.org/papers/w26186