コラムバックナンバー
メールマガジン2015年5月27日号より a2i代表 大内 範行
今日は、相関関係と因果関係について考えてみたいと思います。
データへの関心が高まる中、統計分析をもとに、相関関係を報告した調査結果の記事を時々目にします。たとえば「スマートフォンを使う子供の成績が悪い」といった調査結果です。
こういった記事が話題になると「それは相関関係を表しているだけで因果関係ではない」という発言やブログ記事も出てきます。誰かが相関関係をもとに煽り気味の記事を書くと、やまびこのように「因果関係」について釘が刺されるという流れです。「相関関係は、因果関係を示しているわけではない(”Correlation does not imply causation”)」は、非常に正しい見解です。特に健康や医療、治安や教育の効果、という問題を取り扱う場合には、相関関係だけで決めつけては不十分でしょう。
因果関係を証明する要素として、たとえば、
1. 統計的に有意で相当に強い相関が見られる
2. 他者がやっても再現性がある
3. もう一度やっても再現性がある
4. 因子から結果が予測可能である
5. 他の知見から考えても納得がいく
などの条件が言われています。ただ、厳密さを要求すればするほど、因果の決定は難しいものです。
一方で、ビッグデータ関連の記事には、「もう因果関係は不要だ」という論調もあります。
「ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。『結論』さえわかれば、『理由』はいらないのである」
「ビッグデータの世界では、ある現象の理由を何が何でも知る必要はない。データがすべてを物語っているからだ」
データ量が十分に多いので、相関関係だけで、十分だという主張です。
この主張が数年前に登場した時、私自身はなるほど「かっこういいな」と感じた覚えがあります。
実際にウェブで仕事を進めていると、特にテレビコマーシャルのウェブへの影響や、ウェブのキャンペーンの店舗への影響といったデータ分析の場合、「相関関係」でさえも結びつけることに苦労します。時系列のデータや、番組ごとのデータ、店舗の地域データなども加味しながら、相関関係を慎重に選び出してレポートにまとめていきます。
そこにさらに、因果関係を立証しろ、と畳み掛けられても、同じ環境を再現することもできませんし、春が夏になっていれば、人の動きも根本的に変わってしまっています。デジタルデータの分析では、因果関係を突き詰めて立証するのは、時間や費用、改善までのスピードを考えると、ほぼ不可能でしょう。
ただ、相関で十分と思いつつも、「因果関係は不要だ」と言い切ってしまってよいのだろうか? という疑問も残ります。
ここからは私個人の意見ですが、普段は因果関係の精度は求めず、大事な問題に対しては「より強い相関関係」を求めていく、という姿勢で取り組んでいます。
具体的な対策としては、以下の3つの方法を心がけています。
1. セグメントを分けたスプリットテストを実施する
Aという施策を実施したセグメントとそうでないセグメントを分けて実施する
2. A/Bテストなどテストは可能な限り長期または複数回に分けて実施する
ツールがOKと言っている期間よりも長期に実施して結果を判断する
3. 精度は求めずサイクルを回すスピードを重視する
ある程度割り切って、果実を得ることを重視し、次々に改善を回していく
そして、最近はこの問題を、部分的に機械学習やAIが解決していくだろう、と考え始めています。
特に統計の世界では、データからある程度の因果関係を導き出す統計手法や、より強い相関を割り出す仕組みを実装したツールが登場しつつあります。
たとえば、アトリビューション分析でも、単純にその広告を見た、という指標だけでなく、効果が出たパスに出現した確率で重み付けして見せたり、同じようにサイト分析でも、コンバージョンにもっとも相関が強い指標や場所を、統計手法から導き出す仕組みも、組み込まれ始めています。こういった新しい手法はもちろん万全ではなく、目標が明確に定義できることや、指標が十分な質と量で確保されることが前提になるなど、その背景や特徴を知った上で導入する必要があります。
そして最後には、どれだけ周囲に納得してもらえるか、という面がもっとも大事なインターフェースだと思います。
因果関係が大事だとしても、因果関係が出せない状況は無価値だと決めつけていては、物事が進みません。その相関をわかりやすく見せる、出てくる疑問に対する答えを用意する、不確実な部分は率直に答える、そういった姿勢も、相関のデータから改善を実現する上では大事な点になるでしょう。
2024/12/10(火)
オンラインセミナー「【GA4導入・活用術】事業会社と自社サービス担当者が語る!」|2024/12/10(火)
GA4を導入したいけれど、チーム内の理解を得られずに進められない、または導入はしたものの活用しきれていない――そんなお悩みはありませんか? …
2024/11/13(水)
オンラインセミナー「参加無料!超初心者向け!GA4にログインはできた。その次に何をすればいいかわからない人のためのセミナー。サイト改善の知恵袋付きです。」|2024/11/13(水)
GA4にログインしても何が何だかさっぱりわからないことは多いですよね。でも、Webサイトのことは知りたいし、できれば改善点も知りたい…。そん …
2024/10/30(水)
オンラインセミナー「コンテンツのKPIと評価~GA4を使った効果分析~」|2024/10/30(水)
オウンドメディアを運営し、コンテンツマーケティングに取り組む企業が増えていますが、「どのように評価すればよいかわからない」「コンバージョンが …
みなさんこんにちは。渋谷にある大学、日本経済大学で教員をしております、金谷武明と申します。以前はGoogleという会社でYouTubeで検索 …
衆議院選挙が終わりました。選挙のたびに開票の時刻と同時に当選確実が出る「出口調査」の予測が話題になります。 今回、開票と同時に出した主要メデ …
【コラム】最終的に固有名詞で指名検索されるにはどのようなコンテンツマーケティングに取り組むべきか、と考える
株式会社真摯 いちしま 泰樹生成AIの急速な展開にやや戸惑い気味です。普段の業務や調べ物に生成AIを利用する機会が増えましたが、コンテンツ制作やアウトプットの課程が変わ …