コラムバックナンバー
メールマガジン2015年5月27日号より a2i代表 大内 範行
今日は、相関関係と因果関係について考えてみたいと思います。
データへの関心が高まる中、統計分析をもとに、相関関係を報告した調査結果の記事を時々目にします。たとえば「スマートフォンを使う子供の成績が悪い」といった調査結果です。
こういった記事が話題になると「それは相関関係を表しているだけで因果関係ではない」という発言やブログ記事も出てきます。誰かが相関関係をもとに煽り気味の記事を書くと、やまびこのように「因果関係」について釘が刺されるという流れです。「相関関係は、因果関係を示しているわけではない(”Correlation does not imply causation”)」は、非常に正しい見解です。特に健康や医療、治安や教育の効果、という問題を取り扱う場合には、相関関係だけで決めつけては不十分でしょう。
因果関係を証明する要素として、たとえば、
1. 統計的に有意で相当に強い相関が見られる
2. 他者がやっても再現性がある
3. もう一度やっても再現性がある
4. 因子から結果が予測可能である
5. 他の知見から考えても納得がいく
などの条件が言われています。ただ、厳密さを要求すればするほど、因果の決定は難しいものです。
一方で、ビッグデータ関連の記事には、「もう因果関係は不要だ」という論調もあります。
「ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。『結論』さえわかれば、『理由』はいらないのである」
「ビッグデータの世界では、ある現象の理由を何が何でも知る必要はない。データがすべてを物語っているからだ」
データ量が十分に多いので、相関関係だけで、十分だという主張です。
この主張が数年前に登場した時、私自身はなるほど「かっこういいな」と感じた覚えがあります。
実際にウェブで仕事を進めていると、特にテレビコマーシャルのウェブへの影響や、ウェブのキャンペーンの店舗への影響といったデータ分析の場合、「相関関係」でさえも結びつけることに苦労します。時系列のデータや、番組ごとのデータ、店舗の地域データなども加味しながら、相関関係を慎重に選び出してレポートにまとめていきます。
そこにさらに、因果関係を立証しろ、と畳み掛けられても、同じ環境を再現することもできませんし、春が夏になっていれば、人の動きも根本的に変わってしまっています。デジタルデータの分析では、因果関係を突き詰めて立証するのは、時間や費用、改善までのスピードを考えると、ほぼ不可能でしょう。
ただ、相関で十分と思いつつも、「因果関係は不要だ」と言い切ってしまってよいのだろうか? という疑問も残ります。
ここからは私個人の意見ですが、普段は因果関係の精度は求めず、大事な問題に対しては「より強い相関関係」を求めていく、という姿勢で取り組んでいます。
具体的な対策としては、以下の3つの方法を心がけています。
1. セグメントを分けたスプリットテストを実施する
Aという施策を実施したセグメントとそうでないセグメントを分けて実施する
2. A/Bテストなどテストは可能な限り長期または複数回に分けて実施する
ツールがOKと言っている期間よりも長期に実施して結果を判断する
3. 精度は求めずサイクルを回すスピードを重視する
ある程度割り切って、果実を得ることを重視し、次々に改善を回していく
そして、最近はこの問題を、部分的に機械学習やAIが解決していくだろう、と考え始めています。
特に統計の世界では、データからある程度の因果関係を導き出す統計手法や、より強い相関を割り出す仕組みを実装したツールが登場しつつあります。
たとえば、アトリビューション分析でも、単純にその広告を見た、という指標だけでなく、効果が出たパスに出現した確率で重み付けして見せたり、同じようにサイト分析でも、コンバージョンにもっとも相関が強い指標や場所を、統計手法から導き出す仕組みも、組み込まれ始めています。こういった新しい手法はもちろん万全ではなく、目標が明確に定義できることや、指標が十分な質と量で確保されることが前提になるなど、その背景や特徴を知った上で導入する必要があります。
そして最後には、どれだけ周囲に納得してもらえるか、という面がもっとも大事なインターフェースだと思います。
因果関係が大事だとしても、因果関係が出せない状況は無価値だと決めつけていては、物事が進みません。その相関をわかりやすく見せる、出てくる疑問に対する答えを用意する、不確実な部分は率直に答える、そういった姿勢も、相関のデータから改善を実現する上では大事な点になるでしょう。
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
2024/02/21(水)
オンラインセミナー「生成AI時代到来 今後のSEOのポイントを考える」|2024/2/21(水)
2023年は生成AI・SGE(Google Search Generative Experience)・Bardの登場、Bingの躍進など、 …
今回のテーマは、「【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義を」の続きです。顧客理解を深めることで …
【コラム】わからないなか、わからないなりに、わかるものをつくろうとする構想力について
アユダンテ株式会社 寳 洋平ヘルプをちゃんと読むこと このコラムを読んでいる方は、デジタルマーケティングに深く携わっている人が多いと想像する。そんなあなたなら、先輩から …
【コラム】GA4を超えて:個票分析のための理想のツールについて考える
アナリティクスアソシエーション 大内 範行前回書いた年初のコラム「顧客行動の再定義」の続きです。 【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義 …