コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2019年11月13日号より
■分析・レポートの際にどんなクロス集計を作るのがいいのか?
おそらくみなさんがよく直面するであろうパズルです。
ある月のウェブサイトの全訪問者(N)が10000人で平均のCVRが1%だったとします。ヘルプページへの流入(セグメントAとします)が100人でCVRが10%、ソーシャルメディアからの流入(セグメントBとします)が1000人でCVRが3%。このときレポートでは「ヘルプページへの流入」「ソーシャルメディアからの流入」どちらのほうをより重要な知見として報告すべきのでしょうか?どちらのセグメントのほうが全体のコンバージョンに対するプラスの貢献度が大きいといえばいいのでしょうか?

この2つのクロス集計の比較になります。セグメントAは全体の平均に比べて10倍もの高いCVRをあげています。しかし100人しかいません。それに対してセグメントBでは平均の3倍のCVRでしかないですが、1000人いるセグメントです。セグメントAはCVRのかい離は大きいが、サイズは小さい。セグメントBはCVRのかい離は小さいものの、サイズが大きい。
トータルでこれらを比較するときには、全体に対するCV貢献のインパクトの大きさで評価する必要があるのです。この場合では総CV数100に対してセグメントAは10コンバージョン、セグメントBは30コンバージョンを生み出しています。全体の平均的なCVRからすると、セグメントAの大きさであれば1CV、セグメントBの大きさであれば10CV程度しか生まないことになります。全体的には本来この程度であるところを、セグメントAは9CVの上乗せ、セグメントBは20CVの上乗せをしているというわけです。つまり全体のCVに対する上乗せ貢献度はセグメントBのほうが大きいということになります。
ではセグメントCの大きさが200人でCVRが10%、セグメントDの大きさが1500人で2%のとき、セグメントCとDのどちらの貢献度が大きいでしょうか。セグメントCの上乗せCV貢献数は18で、セグメントDでは15になります。つまりセグメントCのほうが僅差で貢献度が大きいのです。
レポートで複数の比較軸でどちらを議論すべきか迷ったとき、いくつか報告すべきセグメント(というより比較軸)が検討材料にあがったとき、どれを選ぶべきか。どのような優先順位で報告すべきか。その指針としてこのような計算方法は覚えておくといいでしょう。そしてこれをアルゴリズムで実現するのが決定木分析という手法になります。
■決定木とは
決定木(decision tree)とは対象をツリー上に分岐させて、濃い集団と薄い集団に分けていくデータマイニングの手法です。分けられた集団はその中でさらに濃いものと薄いものに分割され・・・を繰り返していきます。

たとえばある店舗で来店人数1000人のうち100人が購入をしたとします。来店数3を境目に人数と購入率が大きく分かれるのでまずそこで全来店者を分割(木を分岐)させます。次に来店数が多いセグメントでは性別で分けると人数と購入率が大きく分かれるので、性別で来店者を分岐させます。これを繰り返すことで購入しやすいセグメントとしにくいセグメントを見出すことができます。同時に購入しやすい条件としにくい条件も明らかになります。
一つ一つの分岐自体はクロス集計そのものです。その時点で分割すべき対象を最も効果的に分割してクロス集計を作るのです。そして分割された集団に対してさらにクロス集計を繰り返していく原理です。ということで全体としてはクロス集計のお化けともいえる手法です。数多くの変数があっても、アルゴリズムを使うと変数をすべて考慮したうえで効率的な分割を実現することができます。これを使った分析が決定木分析です。
ルールベースのアウトプット(先の例でいうと来店回数や性別)が出る、ツリーという構造のわかりやすさから、さまざまなデータマイニングの手法の中で結果の可読性が最も高い説明に効果的な手法と言われています。ということで決定木は分析の本質を最もよく反映したデータマイニング手法の一つであるといえるのです。次回は分割のアルゴリズムに触れながら決定木を実際の分析に生かす方法を紹介します。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2026/01/22(木)
オンラインセミナー「検索行動・消費者分析ツール「DS.INSIGHT」の最新機能と活用事例」|2026/1/22(木)
ツール研究会の3回目は、DS.INSIGHTがテーマです。 このセミナーは、どなたでも参加可能です。 一般の方の申込には、ライト会員(登録・ …
2025/12/03(水)
オンラインセミナー「GAの分析とモニタリングの適材適所ガイド― Looker Studio、探索、スプレッドシート、MCPサーバーの使い分け」|2025/12/3(水)
このセミナーでは、Google アナリティクス 4(GA4)のデータを効果的に活用するために、目的に応じた最適なレポート機能の選び方と使い分 …
2025/11/18(火)
【大型イベント開催】a2i秋の広告祭 デジタル広告の役割を再設計しよう|2025/11/18(火)
a2i秋の広告祭 デジタル広告の役割を再設計しよう デジタル広告のこれからを半日で学ぶ!豪華11名のスペシャリストが集結! デジタル広告のテ …
【コラム】生成AI時代 データ分析に必要な”料理人のスキル”は?
アナリティクスアソシエーション 大内 範行「生成AIでデータ分析は、どこまで簡単でおいしくなるのだろうか?」 今年最後のコラムです。来年に向けてそんなテーマを考えてみたいと思います。 …
【コラム】AIの活用が進む今だからこそ、デジタルに依存しすぎない視点を
Yuwai株式会社 田中 広樹a2i秋の広告祭が終わりました。ご参加いただいた方、ご登壇いただいた方、会場の運営をいただいた方皆さまに感謝を述べたいと思います。ありがとう …
【コラム】AI自動化が進むマーケティングの未来 あなたはどう生きるか? a2i秋の広告祭の実感
アナリティクスアソシエーション 大内 範行a2i秋の広告祭が終わりました。 この「a2i秋の広告祭」は、「祭」と銘打った割には極めてマジメなイベントでした。 このイベントを構想して、 …