コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2021年10月6日号より
ABテストをするとき
「施策AとBを比較した結果、施策AのほうがCVR(目的の指標)が高いので優れていると判断した」
そこで思考が終わっていませんか?本来は施策Aと施策Bの間に差がないのに、たまたまその期間のデータの確率的な現れ方(データのばらつき)の問題でAのほうが優れているという結果が出てしまうこともあります。
まずABテストというのは仮説検定の一つの形です。仮説検定は100年ほど前に生み出された方法ですが、大きく2つの流儀があり、どちらも有効なものとして現在も活用されています。
まずその中で最も伝統的なフィッシャーの考え方を紹介します。フィッシャー流の仮説検定とはある仮説(これを帰無仮説といいます)を想定し、データに基づいてその仮説が否定(棄却)されるかどうかを見る手法です。ABテストでは帰無仮説が「AとBの間に差がない」で、これをデータによって否定することを試みるのです。これが否定されると「AとBの間に違いがある」という結論が導き出されることになります。
ややこしいのですが積極的に「AとBの間に違いがある」という仮説を選ぶのではなく、「AとBの間に差がない」と言ったときに無理があるからという消極的な理由で「AとBの間に違いがある」という結論を導き出すのです。このあたりは直感的ではないかもしれませんが、手続き上はそう考えなければならないということは留意しておいてください。そしてこの流儀ではよく言われる「サンプルサイズ」という考え方はありません。「AとBの間に差がない」と仮定したときに、今の結果が起こるのがどのくらいレアであるか、それだけです。レア度を表す確率をp値といいます。
これに対して、2つの仮説を比較して一方を選択して帰結する考え方があります。たとえばある施策に対して改善施策を実施して比較する場合に、「改善施策のほうがオリジナルより優れている」か「変わらない」かの2つの仮説を比較する方法です。ネイマンとピアソンの2人が提示した考え方です。
先の場合は「AとBの間に差がない」ことに対する是非を問うだけだったのですが、こちらは「AとBの間に差がない」と「AがBより優れている」という2つの仮説を比較します。
フィッシャー流は消極的だったのですが、ネイマン・ピアソン流は積極的ですよね(ここでの消極的/積極的の違いは決していいか悪いかを示すものではありません。ニュートラルな意味で手法を比較した考え方です)。
そして求められるのは本来「AとBの間に差がない」ときには「AとBの間に差がない」と判定し、本来「AがBより優れている」ときには「AがBより優れている」と判定することです。本来「AとBの間に差がない」のに「AがBより優れている」と判定することは望ましくありません。これを第1種の過誤(Type I error)または偽陽性(False positive)といいます。また本来「AがBより優れている」のに「AとBの間に差がない」と判定することは望ましくありません。これを第2種の過誤(Type II error)または偽陰性(False negative)といいます。
次回はこの2種類の過誤についての関連話題と、これらを用いてどのように仮説を選択するのかを説明します。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2025/10/30(木)
オンラインセミナー「Microsoft Clarity×GA4横断分析で実現するサイト改善」|2025/10/30(木)
ヒートマップやセッションレコーディングを導入しているものの、「何を見ればよいのか分からない」「改善施策に繋がらない」と感じたことはありません …
2025/11/18(火)
【大型イベント開催】a2i秋の広告祭 デジタル広告の役割を再設計しよう|2025/11/18(火)
a2i秋の広告祭 デジタル広告の役割を再設計しよう デジタル広告のこれからを半日で学ぶ!豪華11名のスペシャリストが集結! デジタル広告のテ …
2025/10/16(木)
オンラインセミナー「Cookieレス時代に取り組むべき攻めと守りの計測方法」|2025/10/16(木)
近年、AppleのITP(Intelligent Tracking Prevention)や各国のプライバシー規制強化により、従来のCook …
【コラム】広告の効果計測、誰を頼ればいいのか? ―混沌を乗り越える越境チーム作り
アナリティクスアソシエーション 大内 範行広告の計測まわりでふつふつと音を立てるマグマ溜まり 「最近の広告レポート、本当にこの数字に頼っていいのかが疑問なんです」 最近、こんな問いか …
【コラム】わからない・忙しい・お金がないをDMAICで解決する
運営堂 森野 誠之イントロ 小さな会社の支援をしていると、やることはわかっていても進まないことが本当に多いです。理由はほぼこの3つ。 わからない 忙しい お金 …
【コラム】参照元Googleめ、お主は私の知っているGoogleではないのだな……
アナリティクスアソシエーション 大内 範行少し前、空気清浄機を買うのに、生成AIに頼ってみました。 おすすめ候補をリストアップしてもらい、機能やスペックを比較し、こだわっているポイン …