コラムバックナンバー
メールマガジン2015年5月27日号より a2i代表 大内 範行
今日は、相関関係と因果関係について考えてみたいと思います。
データへの関心が高まる中、統計分析をもとに、相関関係を報告した調査結果の記事を時々目にします。たとえば「スマートフォンを使う子供の成績が悪い」といった調査結果です。
こういった記事が話題になると「それは相関関係を表しているだけで因果関係ではない」という発言やブログ記事も出てきます。誰かが相関関係をもとに煽り気味の記事を書くと、やまびこのように「因果関係」について釘が刺されるという流れです。「相関関係は、因果関係を示しているわけではない(”Correlation does not imply causation”)」は、非常に正しい見解です。特に健康や医療、治安や教育の効果、という問題を取り扱う場合には、相関関係だけで決めつけては不十分でしょう。
因果関係を証明する要素として、たとえば、
1. 統計的に有意で相当に強い相関が見られる
2. 他者がやっても再現性がある
3. もう一度やっても再現性がある
4. 因子から結果が予測可能である
5. 他の知見から考えても納得がいく
などの条件が言われています。ただ、厳密さを要求すればするほど、因果の決定は難しいものです。
一方で、ビッグデータ関連の記事には、「もう因果関係は不要だ」という論調もあります。
「ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。『結論』さえわかれば、『理由』はいらないのである」
「ビッグデータの世界では、ある現象の理由を何が何でも知る必要はない。データがすべてを物語っているからだ」
データ量が十分に多いので、相関関係だけで、十分だという主張です。
この主張が数年前に登場した時、私自身はなるほど「かっこういいな」と感じた覚えがあります。
実際にウェブで仕事を進めていると、特にテレビコマーシャルのウェブへの影響や、ウェブのキャンペーンの店舗への影響といったデータ分析の場合、「相関関係」でさえも結びつけることに苦労します。時系列のデータや、番組ごとのデータ、店舗の地域データなども加味しながら、相関関係を慎重に選び出してレポートにまとめていきます。
そこにさらに、因果関係を立証しろ、と畳み掛けられても、同じ環境を再現することもできませんし、春が夏になっていれば、人の動きも根本的に変わってしまっています。デジタルデータの分析では、因果関係を突き詰めて立証するのは、時間や費用、改善までのスピードを考えると、ほぼ不可能でしょう。
ただ、相関で十分と思いつつも、「因果関係は不要だ」と言い切ってしまってよいのだろうか? という疑問も残ります。
ここからは私個人の意見ですが、普段は因果関係の精度は求めず、大事な問題に対しては「より強い相関関係」を求めていく、という姿勢で取り組んでいます。
具体的な対策としては、以下の3つの方法を心がけています。
1. セグメントを分けたスプリットテストを実施する
Aという施策を実施したセグメントとそうでないセグメントを分けて実施する
2. A/Bテストなどテストは可能な限り長期または複数回に分けて実施する
ツールがOKと言っている期間よりも長期に実施して結果を判断する
3. 精度は求めずサイクルを回すスピードを重視する
ある程度割り切って、果実を得ることを重視し、次々に改善を回していく
そして、最近はこの問題を、部分的に機械学習やAIが解決していくだろう、と考え始めています。
特に統計の世界では、データからある程度の因果関係を導き出す統計手法や、より強い相関を割り出す仕組みを実装したツールが登場しつつあります。
たとえば、アトリビューション分析でも、単純にその広告を見た、という指標だけでなく、効果が出たパスに出現した確率で重み付けして見せたり、同じようにサイト分析でも、コンバージョンにもっとも相関が強い指標や場所を、統計手法から導き出す仕組みも、組み込まれ始めています。こういった新しい手法はもちろん万全ではなく、目標が明確に定義できることや、指標が十分な質と量で確保されることが前提になるなど、その背景や特徴を知った上で導入する必要があります。
そして最後には、どれだけ周囲に納得してもらえるか、という面がもっとも大事なインターフェースだと思います。
因果関係が大事だとしても、因果関係が出せない状況は無価値だと決めつけていては、物事が進みません。その相関をわかりやすく見せる、出てくる疑問に対する答えを用意する、不確実な部分は率直に答える、そういった姿勢も、相関のデータから改善を実現する上では大事な点になるでしょう。
2025/03/05(水)
オンラインセミナー「あの会社はこんなに伸びた!新規受注額2倍&年間受注額3倍の刃物メーカー、平均受注金額5倍のウェブ制作会社の事例」|2025/3/5(水)
2021年は刃物メーカーの1人担当者さん、2022年には小さな制作会社さんの事例を紹介しました。あれから2~3年たっても着実に成長されていま …
2025/02/19(水)
オンラインセミナー「Google 広告 P-MAX 解体新書 ~究極の自動化とデータドリブンアトリビューション~」|2025/2/19(水)
Google の最新 AI を活用し、Google 広告の究極の自動化を実現する P-MAX(Performance Max)キャンペーン。 …
2025/01/30(木)
オンラインセミナー「JADE presents:GA4と「Amethyst」でここまでできるユーザー分析」|2025/1/30(木)
Googleアナリティクス4(GA4)は見たいデータをなかなか見られない、使いにくいという声をよく耳にします。また「ユーザー軸のツール」と謳 …
【コラム】プライバシー保護と法律 この山は面倒ですが登り始めましょう
アナリティクスアソシエーション 大内 範行ここ数年で個人情報保護などプライバシー保護の法律面の理解を深めて、いくつかのプロジェクトに関わるようになりました。 今では法律理解は、マーケ …
【コラム】丸山さん、アクセス解析って本当に終わるんですか? 「GA4は宝の地図ではなかったが…」
アナリティクスアソシエーション 大内 範行今回はQAアナリティクスの丸山 耕二さんに、年明けの話題の記事についてインタビューしました。 「アクセス解析の終焉と新時代の幕開け。2025 …
【コラム】まだしばらくは顧客層に近いデータに重きを置いていたい、けれども
株式会社真摯 いちしま 泰樹「アクセス解析ではどんな視点で取り組むのが良いですか?」 少し前に、雑談から軽い相談をいただきました。その人はアクセス解析に関わることはあれ …