コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2021年3月17日号より
先日天下のNatureという雑誌に以下のレポートが発表されました。
Stay-at-home policy is a case of exception fallacy: an internet-based ecological study
自粛(Stay-at-home)と新型コロナウイルスの感染抑制には関係がないというものです。結論の内容はともかく、この論文で使われている考え方がわれわれの日々の分析においても有用なのでそれを紹介します。
自宅で過ごすことによって死亡者数/百万人が減少するという証拠は見つかりませんでした。
調査は一部Googleのコミュニティモビリティレポートのデータも使って行われています。
https://www.google.com/covid19/mobility/
■例外的誤謬
「exception fallacy」と言っています。例外的誤謬と訳すことがありますが、これは一部の事例に基づいて、物事を判断する。その事例が母集団全体を反映していない例外的な事例であって、その結果間違った認識をすることを言います。
目立つ事象だけに基づいて、観測されない事象が多くあることを無視して一般化してしまうことがまさにそうですね。世の中でありがちな、声の大きい主張だけに耳を傾けてそれがすべてだと信じてしまうのと同じです。これが「自粛→感染抑制」の関係において発生しているというわけです。
■施策の有効性を測るための比較
自粛施策を行った地域(国や都市)と行っていない地域との間で比較します。自粛以外の変数(いわゆる共変量)が類似の傾向を持つ地域で自粛政策を行った地域とそうでない地域を1個ずつ抽出してペアを作ります。そのペアが33組あり、33組の比較を行い、その比較が全体的にどのような傾向だったかを見ています。
これは決して「自粛」という政策のみでなく一般的な施策介入においても有効なフレームワーク(介入効果を測る因果推論)なので、知っておくといいです。
■正しい時系列分析の手法を用いる
調査では時系列分析を行っています。単純に期間全体での自粛の度合いと死亡数を見ているのではなく、時系列(トレンドや周期性)を考慮した比較をしています。そして時系列には正しい時系列的取り扱いをする必要があり、それをしないと本来ありえない関係を因果関係としてとして導くことになってしまいます(見せかけの回帰)。
日々の仕事の中で施策を評価する、比較を行う際も、時系列は考慮すべきケースが多いです。われわれが分析に使うデータには実際にはトレンドや周期性(季節、曜日の影響)があります。たとえば売上に対する施策(介入)の影響を評価する際には、売上に対するトレンドや曜日の影響を除外する必要があります。そのためにさまざまなテクニックがあります。
この調査でもそういったものが使われています。日次の死亡率のデータから週単位に集計して、さらに死亡率そのものを見るのではなく今週の死亡率と前週の死亡率の差分をとっています。自粛の度合いについても今週の自粛度と先週の自粛度の差分をとっています。こういったテクニックが正しい時系列分析の手法であり、それをしないと誤った結論を導くことになるわけです。
時系列の扱いは技術的に高度になるのでデータを工夫してなるべく避けたいところではあるのですが、これに対して同時期に行うスプリットテストでは時系列を考慮する必要はありません。簡単に施策を評価できるのがABテストです。そういう意味でもABテスト(randomized controlled testという類の手法)はおすすめの手法です。
正しくデータを見る。正しい手法でデータを見る。
それはみなさんの日々の仕事においても、新型コロナウイルスに対しても、同じことです。日々の仕事では正しくデータを扱えてもウイルスに対してはそれができないなどということはあり得ません。それができないのはデータに対する姿勢と手法が間違っているということになります。データ分析においては扱う題材が何であれ、手法は共通しています。日々の業務で接するデータだけでなく、いろいろな題材から分析手法を学ぶことはおすすめです。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2023/06/15(木)
オンラインセミナー「【基礎と応用】Google タグマネージャーでGA4のタグを設定してみよう」|2023/6/15(木)
ユニバーサルアナリティクスの計測停止を目前にしてGA4への移行がまったなしとなりました。移行を機にGoogle タグマネージャーでのタグ管理 …
2023/06/07(水)
【ランチタイム開催】「クラシコムにおける「データ」とは?データ基盤の立ち上げと活用について」|2023/6/7(水)
セミナー・イベント名 【ランチタイム開催】「クラシコムにおける「データ」とは?データ基盤の立ち上げと活用について」 セミナー・イベント内容 …
2023/05/17(水)
オンラインセミナー「注目 Microsoft 広告とAI~デジタルマーケティングはどう変わるのか?」|2023/5/17(水)
2022年5月末に日本市場でローンチされたMicrosoft 広告が急速に浸透しています。 また、Microsoftは対話型AIを搭載した検 …
【コラム】BardとGPTに聞くAI時代のSEO 長尾キーワードが鍵?
アナリティクスアソシエーション 大内 範行前回の大内のコラムは、要点を伝えてChatGPTに書いてもらいました。今回はGoogle BardとChatGPTの両方の助けを借りながら書 …
a2iでのコラム連載が最後になるのですが、意外と忘れられがちな、でもデータの分析や活用のために重要な視点をおさらいします。普遍的なことから、 …
【コラム】アナリティクスの新時代:データ分析の課題にどう取り組むべきか?
アナリティクスアソシエーション 大内 範行※ このコラムは大内が趣旨をプロンプトに投げて、ChatGPT(GPT-4)が書いたものを微調整しました。また、題名はGPT-4が出した案を …