コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2019年11月13日号より
■分析・レポートの際にどんなクロス集計を作るのがいいのか?
おそらくみなさんがよく直面するであろうパズルです。
ある月のウェブサイトの全訪問者(N)が10000人で平均のCVRが1%だったとします。ヘルプページへの流入(セグメントAとします)が100人でCVRが10%、ソーシャルメディアからの流入(セグメントBとします)が1000人でCVRが3%。このときレポートでは「ヘルプページへの流入」「ソーシャルメディアからの流入」どちらのほうをより重要な知見として報告すべきのでしょうか?どちらのセグメントのほうが全体のコンバージョンに対するプラスの貢献度が大きいといえばいいのでしょうか?

この2つのクロス集計の比較になります。セグメントAは全体の平均に比べて10倍もの高いCVRをあげています。しかし100人しかいません。それに対してセグメントBでは平均の3倍のCVRでしかないですが、1000人いるセグメントです。セグメントAはCVRのかい離は大きいが、サイズは小さい。セグメントBはCVRのかい離は小さいものの、サイズが大きい。
トータルでこれらを比較するときには、全体に対するCV貢献のインパクトの大きさで評価する必要があるのです。この場合では総CV数100に対してセグメントAは10コンバージョン、セグメントBは30コンバージョンを生み出しています。全体の平均的なCVRからすると、セグメントAの大きさであれば1CV、セグメントBの大きさであれば10CV程度しか生まないことになります。全体的には本来この程度であるところを、セグメントAは9CVの上乗せ、セグメントBは20CVの上乗せをしているというわけです。つまり全体のCVに対する上乗せ貢献度はセグメントBのほうが大きいということになります。
ではセグメントCの大きさが200人でCVRが10%、セグメントDの大きさが1500人で2%のとき、セグメントCとDのどちらの貢献度が大きいでしょうか。セグメントCの上乗せCV貢献数は18で、セグメントDでは15になります。つまりセグメントCのほうが僅差で貢献度が大きいのです。
レポートで複数の比較軸でどちらを議論すべきか迷ったとき、いくつか報告すべきセグメント(というより比較軸)が検討材料にあがったとき、どれを選ぶべきか。どのような優先順位で報告すべきか。その指針としてこのような計算方法は覚えておくといいでしょう。そしてこれをアルゴリズムで実現するのが決定木分析という手法になります。
■決定木とは
決定木(decision tree)とは対象をツリー上に分岐させて、濃い集団と薄い集団に分けていくデータマイニングの手法です。分けられた集団はその中でさらに濃いものと薄いものに分割され・・・を繰り返していきます。

たとえばある店舗で来店人数1000人のうち100人が購入をしたとします。来店数3を境目に人数と購入率が大きく分かれるのでまずそこで全来店者を分割(木を分岐)させます。次に来店数が多いセグメントでは性別で分けると人数と購入率が大きく分かれるので、性別で来店者を分岐させます。これを繰り返すことで購入しやすいセグメントとしにくいセグメントを見出すことができます。同時に購入しやすい条件としにくい条件も明らかになります。
一つ一つの分岐自体はクロス集計そのものです。その時点で分割すべき対象を最も効果的に分割してクロス集計を作るのです。そして分割された集団に対してさらにクロス集計を繰り返していく原理です。ということで全体としてはクロス集計のお化けともいえる手法です。数多くの変数があっても、アルゴリズムを使うと変数をすべて考慮したうえで効率的な分割を実現することができます。これを使った分析が決定木分析です。
ルールベースのアウトプット(先の例でいうと来店回数や性別)が出る、ツリーという構造のわかりやすさから、さまざまなデータマイニングの手法の中で結果の可読性が最も高い説明に効果的な手法と言われています。ということで決定木は分析の本質を最もよく反映したデータマイニング手法の一つであるといえるのです。次回は分割のアルゴリズムに触れながら決定木を実際の分析に生かす方法を紹介します。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2025/11/18(火)
【大型イベント開催】a2i秋の広告祭 デジタル広告の役割を再設計しよう|2025/11/18(火)
a2i秋の広告祭 デジタル広告の役割を再設計しよう デジタル広告のこれからを半日で学ぶ!豪華11名のスペシャリストが集結! デジタル広告のテ …
2025/10/30(木)
オンラインセミナー「Microsoft Clarity×GA4横断分析で実現するサイト改善」|2025/10/30(木)
ヒートマップやセッションレコーディングを導入しているものの、「何を見ればよいのか分からない」「改善施策に繋がらない」と感じたことはありません …
2025/10/16(木)
オンラインセミナー「Cookieレス時代に取り組むべき攻めと守りの計測方法」|2025/10/16(木)
近年、AppleのITP(Intelligent Tracking Prevention)や各国のプライバシー規制強化により、従来のCook …
株式会社ナンバーの渋谷です。今回は「データ分析の民主化」が進む中で、その土台となる「データ整備」の重要性について考えてみたいと思います。 結 …
【コラム】広告の効果計測、誰を頼ればいいのか? ―混沌を乗り越える越境チーム作り
アナリティクスアソシエーション 大内 範行広告の計測まわりでふつふつと音を立てるマグマ溜まり 「最近の広告レポート、本当にこの数字に頼っていいのかが疑問なんです」 最近、こんな問いか …
【コラム】わからない・忙しい・お金がないをDMAICで解決する
運営堂 森野 誠之イントロ 小さな会社の支援をしていると、やることはわかっていても進まないことが本当に多いです。理由はほぼこの3つ。 わからない 忙しい お金 …