コラムバックナンバー
メールマガジン2015年5月27日号より a2i代表 大内 範行
今日は、相関関係と因果関係について考えてみたいと思います。
データへの関心が高まる中、統計分析をもとに、相関関係を報告した調査結果の記事を時々目にします。たとえば「スマートフォンを使う子供の成績が悪い」といった調査結果です。
こういった記事が話題になると「それは相関関係を表しているだけで因果関係ではない」という発言やブログ記事も出てきます。誰かが相関関係をもとに煽り気味の記事を書くと、やまびこのように「因果関係」について釘が刺されるという流れです。「相関関係は、因果関係を示しているわけではない(”Correlation does not imply causation”)」は、非常に正しい見解です。特に健康や医療、治安や教育の効果、という問題を取り扱う場合には、相関関係だけで決めつけては不十分でしょう。
因果関係を証明する要素として、たとえば、
1. 統計的に有意で相当に強い相関が見られる
2. 他者がやっても再現性がある
3. もう一度やっても再現性がある
4. 因子から結果が予測可能である
5. 他の知見から考えても納得がいく
などの条件が言われています。ただ、厳密さを要求すればするほど、因果の決定は難しいものです。
一方で、ビッグデータ関連の記事には、「もう因果関係は不要だ」という論調もあります。
「ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。『結論』さえわかれば、『理由』はいらないのである」
「ビッグデータの世界では、ある現象の理由を何が何でも知る必要はない。データがすべてを物語っているからだ」
データ量が十分に多いので、相関関係だけで、十分だという主張です。
この主張が数年前に登場した時、私自身はなるほど「かっこういいな」と感じた覚えがあります。
実際にウェブで仕事を進めていると、特にテレビコマーシャルのウェブへの影響や、ウェブのキャンペーンの店舗への影響といったデータ分析の場合、「相関関係」でさえも結びつけることに苦労します。時系列のデータや、番組ごとのデータ、店舗の地域データなども加味しながら、相関関係を慎重に選び出してレポートにまとめていきます。
そこにさらに、因果関係を立証しろ、と畳み掛けられても、同じ環境を再現することもできませんし、春が夏になっていれば、人の動きも根本的に変わってしまっています。デジタルデータの分析では、因果関係を突き詰めて立証するのは、時間や費用、改善までのスピードを考えると、ほぼ不可能でしょう。
ただ、相関で十分と思いつつも、「因果関係は不要だ」と言い切ってしまってよいのだろうか? という疑問も残ります。
ここからは私個人の意見ですが、普段は因果関係の精度は求めず、大事な問題に対しては「より強い相関関係」を求めていく、という姿勢で取り組んでいます。
具体的な対策としては、以下の3つの方法を心がけています。
1. セグメントを分けたスプリットテストを実施する
Aという施策を実施したセグメントとそうでないセグメントを分けて実施する
2. A/Bテストなどテストは可能な限り長期または複数回に分けて実施する
ツールがOKと言っている期間よりも長期に実施して結果を判断する
3. 精度は求めずサイクルを回すスピードを重視する
ある程度割り切って、果実を得ることを重視し、次々に改善を回していく
そして、最近はこの問題を、部分的に機械学習やAIが解決していくだろう、と考え始めています。
特に統計の世界では、データからある程度の因果関係を導き出す統計手法や、より強い相関を割り出す仕組みを実装したツールが登場しつつあります。
たとえば、アトリビューション分析でも、単純にその広告を見た、という指標だけでなく、効果が出たパスに出現した確率で重み付けして見せたり、同じようにサイト分析でも、コンバージョンにもっとも相関が強い指標や場所を、統計手法から導き出す仕組みも、組み込まれ始めています。こういった新しい手法はもちろん万全ではなく、目標が明確に定義できることや、指標が十分な質と量で確保されることが前提になるなど、その背景や特徴を知った上で導入する必要があります。
そして最後には、どれだけ周囲に納得してもらえるか、という面がもっとも大事なインターフェースだと思います。
因果関係が大事だとしても、因果関係が出せない状況は無価値だと決めつけていては、物事が進みません。その相関をわかりやすく見せる、出てくる疑問に対する答えを用意する、不確実な部分は率直に答える、そういった姿勢も、相関のデータから改善を実現する上では大事な点になるでしょう。
2026/05/20(水)
セミナー「事故から学ぶ理想のGoogle タグ マネージャー運用 ― 計測トラブルを防ぐルール設計と運用の現実解」 【a2i DEEP Connection】|2026/5/20(水)
誰も全体を管理していない、複数の支援会社がそれぞれのルールで触っている、気付かないまま計測トラブルが起きている。そんなGoogle タグ マ …
2026/04/22(水)
オンラインセミナー「「AIで分析」と聞いて身構えるみなさんへ。コード不要で進める時短ウェブサイト改善」|2026/4/22(水)
「AIで分析」と聞いて身構えていませんか?まずは30秒で内容をご確認ください 「AIで分析」と聞いた瞬間、急にハードルが跳ね上がる感覚はあり …
2026/03/18(水)
オンラインセミナー「GA4×生成AIで改善提案の精度を高める ― AIから「使える施策」を引き出す実践アプローチ ―」|2026/3/18(水)
GA4によるサイト改善は、生成AIと組み合わせることで新しい段階に入りつつあります。 しかし一方で、「AIに分析させても表面的なコメントしか …
【コラム】「キバン」と「ヒョーバン」── GoogleのAI最適化ベストプラクティスから読み取る両端
アナリティクスアソシエーション 大内 範行GoogleがAIに選ばれるコンテンツのベストプラクティスを公開しました。 「ついにGoogleが公式な指針を出したのか!」と、生成AI最適 …
【コラム】AIで支援会社の仕事はどう変わる?──意思決定支援の超伴走型へ
アナリティクスアソシエーション 大内 範行支援会社はお役御免になるのか? 「生成AIがすごすぎて私の仕事がなくなるか不安です」 支援会社やコンサルティングのそんな声を、よく耳にするよ …
【コラム】生成AI時代だからこそ、私はペルソナを大切にしたい
株式会社A-can 白砂 ゆき子「ペルソナなんて、いらないのでは?」 最近、そんな声を聞く機会が増えました。 私がペルソナの要・不要を改めて考えるきっかけとなったのは、最近 …