コラムバックナンバー

今日は、相関関係と因果関係について考えてみたいと思います。

データへの関心が高まる中、統計分析をもとに、相関関係を報告した調査結果の記事を時々目にします。たとえば「スマートフォンを使う子供の成績が悪い」といった調査結果です。
こういった記事が話題になると「それは相関関係を表しているだけで因果関係ではない」という発言やブログ記事も出てきます。誰かが相関関係をもとに煽り気味の記事を書くと、やまびこのように「因果関係」について釘が刺されるという流れです。「相関関係は、因果関係を示しているわけではない(”Correlation does not imply causation”)」は、非常に正しい見解です。特に健康や医療、治安や教育の効果、という問題を取り扱う場合には、相関関係だけで決めつけては不十分でしょう。

因果関係を証明する要素として、たとえば、

1. 統計的に有意で相当に強い相関が見られる
2. 他者がやっても再現性がある
3. もう一度やっても再現性がある
4. 因子から結果が予測可能である
5. 他の知見から考えても納得がいく

などの条件が言われています。ただ、厳密さを要求すればするほど、因果の決定は難しいものです。

一方で、ビッグデータ関連の記事には、「もう因果関係は不要だ」という論調もあります。
「ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。『結論』さえわかれば、『理由』はいらないのである」
「ビッグデータの世界では、ある現象の理由を何が何でも知る必要はない。データがすべてを物語っているからだ」
データ量が十分に多いので、相関関係だけで、十分だという主張です。
この主張が数年前に登場した時、私自身はなるほど「かっこういいな」と感じた覚えがあります。

実際にウェブで仕事を進めていると、特にテレビコマーシャルのウェブへの影響や、ウェブのキャンペーンの店舗への影響といったデータ分析の場合、「相関関係」でさえも結びつけることに苦労します。時系列のデータや、番組ごとのデータ、店舗の地域データなども加味しながら、相関関係を慎重に選び出してレポートにまとめていきます。
そこにさらに、因果関係を立証しろ、と畳み掛けられても、同じ環境を再現することもできませんし、春が夏になっていれば、人の動きも根本的に変わってしまっています。デジタルデータの分析では、因果関係を突き詰めて立証するのは、時間や費用、改善までのスピードを考えると、ほぼ不可能でしょう。

ただ、相関で十分と思いつつも、「因果関係は不要だ」と言い切ってしまってよいのだろうか? という疑問も残ります。

ここからは私個人の意見ですが、普段は因果関係の精度は求めず、大事な問題に対しては「より強い相関関係」を求めていく、という姿勢で取り組んでいます。

具体的な対策としては、以下の3つの方法を心がけています。

1. セグメントを分けたスプリットテストを実施する
 Aという施策を実施したセグメントとそうでないセグメントを分けて実施する

2. A/Bテストなどテストは可能な限り長期または複数回に分けて実施する
 ツールがOKと言っている期間よりも長期に実施して結果を判断する

3. 精度は求めずサイクルを回すスピードを重視する
 ある程度割り切って、果実を得ることを重視し、次々に改善を回していく

そして、最近はこの問題を、部分的に機械学習やAIが解決していくだろう、と考え始めています。
特に統計の世界では、データからある程度の因果関係を導き出す統計手法や、より強い相関を割り出す仕組みを実装したツールが登場しつつあります。
たとえば、アトリビューション分析でも、単純にその広告を見た、という指標だけでなく、効果が出たパスに出現した確率で重み付けして見せたり、同じようにサイト分析でも、コンバージョンにもっとも相関が強い指標や場所を、統計手法から導き出す仕組みも、組み込まれ始めています。こういった新しい手法はもちろん万全ではなく、目標が明確に定義できることや、指標が十分な質と量で確保されることが前提になるなど、その背景や特徴を知った上で導入する必要があります。

そして最後には、どれだけ周囲に納得してもらえるか、という面がもっとも大事なインターフェースだと思います。
因果関係が大事だとしても、因果関係が出せない状況は無価値だと決めつけていては、物事が進みません。その相関をわかりやすく見せる、出てくる疑問に対する答えを用意する、不確実な部分は率直に答える、そういった姿勢も、相関のデータから改善を実現する上では大事な点になるでしょう。

★メールマガジンのバックナンバーはこちら

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

  • 【コラム】Googleアナリティクスは分析ツールではない?

    アナリティクスアソシエーション 大内 範行
    発信元:メールマガジン2024年6月12日号より

    「Googleアナリティクスは分析のツールではありません。ここを誤解している人が多い。製品名を変えてほしい」 題名にも引用したこの言葉は、ア …

  • 【コラム】「GA4でアプリ行動を計測する」というのはどういうことか?

    株式会社イー・エージェンシー 本舩坂 香
    発信元:メールマガジン2024年5月29日号より

    こんにちは、株式会社イー・エージェンシー シニアコンサルタントの本舩坂(もとふなさか)です。 日頃の業務では、Google アナリティクス …

  • 【コラム】ChatGPT-4oの登場で考えたこと

    アナリティクスアソシエーション 大内 範行
    発信元:メールマガジン2024年5月15日号より

    ChatGPTが新たな改良バージョンとしてChatGPT-4oを発表しました。この新しい生成AIは、テキストだけでなく、音声、画像、動画も含 …

バックナンバー一覧へ