コンテンツにスキップ

大谷HRの翌日、日経225は上がるのか? ── データで検証した結果と3つの教訓

対象 / ポイント

対象: 投資経験はあるが統計的検証の手法に馴染みがない方。「大谷が打つと株が上がる」という話を聞いたことがある方。データ分析で本物のシグナルと偶然を見分ける考え方を身につけたい方。

ポイント:

  • 大谷HR翌日の日経225寄付きギャップは単純比較で統計的有意(t=2.07, p=0.038)だが、米国株をコントロールすると有意性が消える
  • デイゲーム/ナイトゲーム分離でS&P500経由の伝播経路と整合的なパターンが見え、完全な疑似相関とは言い切れない
  • 投資シグナルとしては実用不可だが、疑似相関・コントロール変数・多重検定の実践教材として価値がある

結論から:2つの問いに対する2つの答え

「大谷翔平がホームランを打った翌朝、日経225は上がる」──SNSで見かけるこの説を、2018年のMLBデビューから2026年4月までの全試合データ(試合日約1,060日、うちHR日約260日)でバックテストした。

用語:バックテストとは

「もしこのルールで過去に売買していたら、儲かっていたか?」を過去のデータで検証すること。今回は「大谷がHRを打った翌朝に日経225を買う」というルールが過去に通用したかを確かめている。ただし、過去に通用したからといって将来も通用する保証はない。

結論は2つの軸に分かれる。

  • 運用判定:NO-GO。 投資シグナルとしては採用できない。効果量が小さく、取引コストを考慮すると収益化は成立しない。
  • 現象仮説:CONDITIONAL-NO-GO(条件付き保留)。 完全な疑似相関とは言い切れない構造がデイ/ナイト分離で見えたが、サンプル不足で確定には至らない。

以下、検証の全過程を追いながら、統計的検証で陥りやすい3つの罠を実例で解説する。


検証の設計:何を、どう測るか

バックテストの信頼性は、実行前の設計で決まる。事後的に「効果がありそうな条件」を探し回ると、偶然の一致を本物と誤認するリスクが跳ね上がる。今回は以下の設計を事前に固定した。

被説明変数は日経225の寄付きギャップ(前日終値→当日始値の変化率)を主変数とした。「大谷のHRがニュースで流れる → 翌朝の寄付きに反映される」という伝播チャネルが最も直接的だからだ1

用語:寄付きギャップとは

株式市場が朝に開いたとき、最初につく値段(始値)が前日の最後の値段(終値)からどれだけ動いたかを示す数字。たとえば前日終値が39,000円で、翌朝の始値が39,100円なら、寄付きギャップは約+0.26%。夜の間に入ったニュースや海外市場の動きが反映されやすいため、「オーバーナイトのセンチメント」を測る指標として使っている。

説明変数は大谷のHR有無をダミー変数(1/0)として使用。SNSでの話題性を代理する「バズ度スコア」(HR=8点、投手勝利=6点、2桁奪三振ボーナス=+5点など重み付け)も設計したが、最もシンプルなHRダミーで十分にシグナルが出るかをまず確認する方針とした2

コントロール変数として、S&P500前日リターン、ドル円変化率、月曜ダミーを投入。これらを入れないと「米国市場が好調な日にたまたま大谷も活躍した」という交絡を排除できない。

データ期間は2018年(MLB1年目)から2026年4月まで。エンゼルス期(2018-2023)とドジャース期(2024-)で構造変化の有無を確認する。


ステップ1:単純比較 ── 一見、効果は「ある」

最も素朴な分析から始める。大谷がHRを打った日(HR日)と打たなかった日(非HR日)で、翌営業日の日経225寄付きギャップを比較した。

期間HR日の寄付きギャップ非HR日
全期間(2018-2026)+0.138%+0.023%+0.115%
エンゼルス期(2018-23)+0.084%+0.032%+0.052%
ドジャース期(2024-)+0.222%+0.001%+0.221%

全期間でt=2.07(p=0.038)。統計学の慣習では「5%有意水準」(t≥1.96)をぎりぎり超えているので、「偶然とは考えにくい」と判断される水準だ。ただし余裕のある有意性ではない。

用語:t値とp値 ── 「偶然じゃなさそう度」の測り方

t値は「観測された差が、データのバラつきに対してどれだけ大きいか」を示す数字。t値が大きいほど「偶然でこの差が出る可能性は低い」ことを意味する。目安として、t≥1.96で「5%有意」(偶然で起きる確率が5%以下)と判断される。

p値は「偶然だけでこの結果が出る確率」そのもの。p=0.038なら「ランダムにやって100回中3.8回しか起きない」ということ。p<0.05(5%未満)が統計学の慣習的な合格ラインだが、この基準自体に絶対的な根拠はなく、あくまで目安である。

さらにドジャース移籍後は差が4倍以上に拡大しており、日本でのメディア露出増加と整合的に見える。

ここで「効果あり」と結論づけたくなるが、次のステップで景色が一変する。


ステップ2:コントロール変数の投入 ── 効果が「消える」

このセクションが答える問い

単純比較で見えた差は、大谷の活躍が原因なのか? それとも第三の要因が両方を動かしているだけなのか?

統計分析で最も重要な手続きの一つが、コントロール変数の投入だ。日経225の動きに影響する主要因(S&P500、ドル円、曜日効果)を回帰モデルに同時投入し、それらの影響を差し引いた上で大谷HR効果が残るかを確認する。

用語:コントロール変数とは

「他の原因の影響を差し引く」ための変数。たとえば「傘を持つ人が多い日は交通事故が多い」というデータがあったとする。これは「雨の日は傘を持つ人も多く、道路も滑りやすいので事故も増える」だけ。「雨かどうか」をコントロール変数に入れれば、傘と事故の見かけの関係は消える。今回はS&P500(米国株)が「雨」に相当する。

変数係数t値判定
S&P500前日リターン+0.63414.67有意
大谷HRダミー+0.077%1.52非有意
月曜ダミー-0.214-1.8910%有意

S&P500を入れた瞬間、HRダミーのt値は2.07から1.52に低下し、有意水準を割り込む。

何が起きているのか。米国市場が好調な日は、S&P500が上がり、同時にドジャースの試合も盛り上がりやすい環境にある(球場の雰囲気、チームの勢いなど複合的な要因)。翌日の日経225はS&P500の上昇を織り込んで高く寄る。この構造では「大谷HR → 日経上昇」に見えるが、実際は「米国市場の好調 → S&P500上昇&大谷活躍の両方」という疑似相関の可能性が高い。

    共通要因の候補(米国市場の好調)
        ↓               ↓
  大谷HR(結果A)    日経上昇(結果B)
        ↓               ↑
     見かけの相関(疑似相関)

この段階で判定はNO-GO。しかし、話はここで終わらなかった。

用語:疑似相関(ぎじそうかん)とは

2つの出来事が「一緒に起きやすい」ように見えるが、実は第三の原因が両方を引き起こしているだけ、という現象。有名な例は「アイスクリームの売上が増える日は水難事故も増える」。アイスが事故を起こすのではなく、「暑い日」がどちらも増やしている。大谷HRと日経上昇の関係も、「米国市場の好調」という第三の要因が両方を動かしている可能性がある。


ステップ3:デイ/ナイト分離 ── 構造が「見える」

このセクションが答える問い

S&P500との疑似相関で全て説明できるなら、なぜ試合の時間帯で結果が変わるのか?

MLBの試合にはデイゲーム(日本時間の深夜〜早朝、S&P500の取引時間と重なる)とナイトゲーム(日本時間の昼、S&P500は閉場済み)がある。このデイ/ナイト分離は当初の検証計画(t+0/t+1/t+2の時間差分析)の延長として実施した。事前にこの分割を明示していたわけではないが、「S&P500の取引時間と試合時間の重複」は因果経路の理論から導かれる自然な分割であり、恣意的なデータマイニングとは性質が異なる3

もし大谷HR効果が純粋な疑似相関なら、デイゲームでもナイトゲームでも同じように「効果があるように見える」はずだ。逆に、S&P500経由の伝播経路が存在するなら、S&P500と同時進行しているデイゲームでのみ効果が出るはずだ。

分類HR日ギャップ差t値n(HR日/非HR日)判定
デイゲーム(S&P500と同時進行)+0.203%2.34107 / 338有意(5%)
ナイトゲーム(S&P500閉場後)+0.052%0.72149 / 435非有意

デイゲームでのみ有意、ナイトゲームでは効果ゼロ。

この結果は2つの解釈を許容する。

解釈A:センチメント伝播経路の存在。 大谷HR → SNS/米国メディアで拡散 → 取引時間中のS&P500にセンチメント的な微小影響 → 翌日の日経に波及。この場合、S&P500は「媒介変数」(原因と結果の間に挟まる変数)であり、コントロール変数に入れると本物の効果まで除去してしまう

用語:媒介変数とは ── コントロールすると消えてしまう本物の効果

「原因 → 中間ステップ → 結果」という連鎖があるとき、その中間ステップが媒介変数。たとえば「運動 → 筋肉量増加 → 基礎代謝アップ」で「筋肉量」が媒介変数。もし「筋肉量」をコントロール変数に入れてしまうと、「運動しても代謝は変わらない」という誤った結論になる。今回の場合、S&P500が媒介変数なら、それをコントロールに入れると大谷効果の本物の経路まで消してしまう可能性がある。

解釈B:精緻化された交絡。 デイゲームの日は単に市場環境が異なる(天候、曜日分布、シーズン時期の偏りなど)。S&P500との同時性は偶然の相関。

現時点ではどちらかを確定するデータは不足している。なお、逆因果検定(HR日の前日の市場リターンが有意かどうか)も実施したが、t≈1.5で有意ではなかった。単純な逆因果仮説──「市場が好調な日にHRが出やすい」──は少なくとも強くは支持されなかったが、完全に排除できたわけでもない。


ポストシーズンの増幅効果

補足的な発見として、2024年と2025年のポストシーズン(計33試合日)を分析した。ディビジョンシリーズ期間の翌日ギャップは+1.03%(n=9)と、レギュラーシーズンの約5倍に達した。サンプルが極小のため統計的有意性は主張できないが、「注目度が高い試合ほど効果が大きい」という方向性はセンチメント伝播仮説と整合する。

なお、ポストシーズンを含めてもS&P500コントロール後のt値は1.37と非有意であり、判定は変わらなかった。2024年ワールドシリーズは大谷の打撃成績が振るわなかったため、シリーズ全体では効果が薄い結果となった。仮にセンチメント効果が実在するなら、注目度の「器」が大きくても「中身」(活躍の有無)が伴わなければ効果は出ない、という解釈になる。


統計的検証で陥りやすい3つの罠

今回の分析過程で直面した罠を整理する。投資に限らず、データ分析全般に適用できる教訓だ。

罠1:コントロール変数を入れないと疑似相関を見逃す

単純比較のt=2.07は「統計的に有意」だが、S&P500を入れると1.52に下がる。2つの変数が同時に動いているからといって、因果関係があるとは限らない。アイスクリームの売上と水難事故が相関するのは、どちらも「夏の暑さ」が原因であるのと同じ構造だ。

投資の文脈では、SNSで「○○が起きると株価が上がる」という主張を見かけたとき、「他に株価を動かす要因が同時に動いていないか?」を常に疑う必要がある。

罠2:事後的なサブグループ分析は有意性を過大評価する

「全期間では微妙だがドジャース期だけ見ると有意」「デイゲームだけ見ると有意」──条件を絞るほど有意な結果が出やすくなる。10個のサブグループを試せば、偶然だけでも1つは5%有意になる計算だ(多重検定問題)。

今回はデイ/ナイト分離に理論的な根拠(S&P500の取引時間との重複)があるため、純粋なデータマイニングではないが、n=107という狭いサンプルでの結果には割り引きが必要だ。

罠3:媒介変数のコントロールは効果を消し得る

コントロール変数は「入れれば入れるほど良い」わけではない。因果経路の途中にある変数(媒介変数)をコントロールに入れると、本物の間接効果まで除去してしまう。

今回の場合、「大谷HR → S&P500にセンチメント影響 → 日経に波及」という経路が本物なら、S&P500をコントロールに入れることは正しくない。しかし、この因果モデル自体を検証するにはより精緻な手法(媒介分析、構造方程式モデルなど)が必要であり、今回のデータだけでは結論が出ない。


最終判定と今後の検証

項目判定
単純比較でのHR効果有意(t=2.07, p=0.038)
S&P500コントロール後非有意(t=1.52)
ドジャース期×デイゲーム有意(t=2.34、HR日107/非HR日338)
運用判定NO-GO
現象仮説CONDITIONAL-NO-GO(保留)

運用判定はNO-GO。仮に効果が本物でも、+0.2%のギャップを安定的に取るトレーディング戦略は、取引コストとスリッページを考慮すると成立しない4

一方、「完全なノイズ」とも断定できない。2026シーズンのデータが蓄積されれば、ドジャース期のデイゲーム効果がout-of-sample(未知のデータ)でも再現されるか検証できる。再現されれば「センチメント伝播経路」の仮説に一歩近づく。再現されなければ、過去データへの過剰適合だったと結論できる。

なお、今回の検証では約45系統の統計検定を実施した。Bonferroni補正(多重検定を考慮した厳格な有意水準)を適用すると、個別に5%有意だった結果も全て非有意となる。この点も「罠2」の実例として留意が必要だ。

用語:Bonferroni補正とは

検定を何回も繰り返すと、「偶然5%で当たる」くじを何枚も引くのと同じで、どれか1つは当たりやすくなる。45回検定すれば、全部偶然でも少なくとも1つが5%有意になる確率は約90%。Bonferroni補正は「検定の回数で合格ラインを割る」方法で、45回なら0.05÷45≒0.001が新しい合格ライン。これを適用すると、今回のp=0.038はとうてい届かない。

データは嘘をつかないが、データの読み方を誤ると、人間が勝手にストーリーを作ってしまう。今回の検証がその実例として参考になれば幸いである。


データソース・分析条件

項目内容
成績データMLB Stats API(公式、認証不要)Player ID: 660271
市場データyfinance(日経225: ^N225、S&P500: ^GSPC、ドル円: USDJPY=X、VIX: ^VIX
分析期間2018年3月(MLBデビュー)〜 2026年4月
試合数レギュラーシーズン1,129試合 + ポストシーズン37試合(日単位集約後1,066日)
デイ/ナイト判定試合開始時刻(UTC)に基づく。S&P500取引時間と重複するものをデイゲームに分類
翌営業日の特定試合日から最大6日先までカレンダー探索(連休・祝日対応)
統計手法Welch t検定、ブートストラップ(通常+ブロック・パーミュテーション)、OLS回帰、グレンジャー因果検定、二項検定
検定系統数約45系統(Bonferroni補正後の有意水準: 0.001)


  1. 日次リターン(終値ベース)も並行して検証したが、ザラ場中のノイズが大きく、寄付きギャップの方がオーバーナイトのセンチメント変化を反映するチャネルとしてクリーンであった。 

  2. バズ度スコアを説明変数にした回帰も実施したが、HRダミー単独と比較して主結論は変わらなかった。スコアと寄付きギャップの相関は+0.029(レギュラーシーズン)と極めて弱く、重み設計の精緻化で結論が覆る可能性は低い。 

  3. ただし事後的な追加分析であることに変わりはなく、多重検定の割り引きは必要。本文「罠2」を参照。 

  4. データ処理上の補足:成績データはMLB Stats API(公式、認証不要)、市場データはyfinance経由で取得。東証休場日(祝日含む)は翌営業日にマッピング。同一試合で複数HR(例:2本塁打)の場合もHRダミーは1(マルチHRボーナスはスコア側で加算)。寄付きギャップは前営業日終値と当日始値の対数リターンで算出。