コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2019年11月13日号より
■分析・レポートの際にどんなクロス集計を作るのがいいのか?
おそらくみなさんがよく直面するであろうパズルです。
ある月のウェブサイトの全訪問者(N)が10000人で平均のCVRが1%だったとします。ヘルプページへの流入(セグメントAとします)が100人でCVRが10%、ソーシャルメディアからの流入(セグメントBとします)が1000人でCVRが3%。このときレポートでは「ヘルプページへの流入」「ソーシャルメディアからの流入」どちらのほうをより重要な知見として報告すべきのでしょうか?どちらのセグメントのほうが全体のコンバージョンに対するプラスの貢献度が大きいといえばいいのでしょうか?
この2つのクロス集計の比較になります。セグメントAは全体の平均に比べて10倍もの高いCVRをあげています。しかし100人しかいません。それに対してセグメントBでは平均の3倍のCVRでしかないですが、1000人いるセグメントです。セグメントAはCVRのかい離は大きいが、サイズは小さい。セグメントBはCVRのかい離は小さいものの、サイズが大きい。
トータルでこれらを比較するときには、全体に対するCV貢献のインパクトの大きさで評価する必要があるのです。この場合では総CV数100に対してセグメントAは10コンバージョン、セグメントBは30コンバージョンを生み出しています。全体の平均的なCVRからすると、セグメントAの大きさであれば1CV、セグメントBの大きさであれば10CV程度しか生まないことになります。全体的には本来この程度であるところを、セグメントAは9CVの上乗せ、セグメントBは20CVの上乗せをしているというわけです。つまり全体のCVに対する上乗せ貢献度はセグメントBのほうが大きいということになります。
ではセグメントCの大きさが200人でCVRが10%、セグメントDの大きさが1500人で2%のとき、セグメントCとDのどちらの貢献度が大きいでしょうか。セグメントCの上乗せCV貢献数は18で、セグメントDでは15になります。つまりセグメントCのほうが僅差で貢献度が大きいのです。
レポートで複数の比較軸でどちらを議論すべきか迷ったとき、いくつか報告すべきセグメント(というより比較軸)が検討材料にあがったとき、どれを選ぶべきか。どのような優先順位で報告すべきか。その指針としてこのような計算方法は覚えておくといいでしょう。そしてこれをアルゴリズムで実現するのが決定木分析という手法になります。
■決定木とは
決定木(decision tree)とは対象をツリー上に分岐させて、濃い集団と薄い集団に分けていくデータマイニングの手法です。分けられた集団はその中でさらに濃いものと薄いものに分割され・・・を繰り返していきます。
たとえばある店舗で来店人数1000人のうち100人が購入をしたとします。来店数3を境目に人数と購入率が大きく分かれるのでまずそこで全来店者を分割(木を分岐)させます。次に来店数が多いセグメントでは性別で分けると人数と購入率が大きく分かれるので、性別で来店者を分岐させます。これを繰り返すことで購入しやすいセグメントとしにくいセグメントを見出すことができます。同時に購入しやすい条件としにくい条件も明らかになります。
一つ一つの分岐自体はクロス集計そのものです。その時点で分割すべき対象を最も効果的に分割してクロス集計を作るのです。そして分割された集団に対してさらにクロス集計を繰り返していく原理です。ということで全体としてはクロス集計のお化けともいえる手法です。数多くの変数があっても、アルゴリズムを使うと変数をすべて考慮したうえで効率的な分割を実現することができます。これを使った分析が決定木分析です。
ルールベースのアウトプット(先の例でいうと来店回数や性別)が出る、ツリーという構造のわかりやすさから、さまざまなデータマイニングの手法の中で結果の可読性が最も高い説明に効果的な手法と言われています。ということで決定木は分析の本質を最もよく反映したデータマイニング手法の一つであるといえるのです。次回は分割のアルゴリズムに触れながら決定木を実際の分析に生かす方法を紹介します。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2024/12/10(火)
オンラインセミナー「【GA4導入・活用術】事業会社と自社サービス担当者が語る!」|2024/12/10(火)
GA4を導入したいけれど、チーム内の理解を得られずに進められない、または導入はしたものの活用しきれていない――そんなお悩みはありませんか? …
2024/11/13(水)
オンラインセミナー「参加無料!超初心者向け!GA4にログインはできた。その次に何をすればいいかわからない人のためのセミナー。サイト改善の知恵袋付きです。」|2024/11/13(水)
GA4にログインしても何が何だかさっぱりわからないことは多いですよね。でも、Webサイトのことは知りたいし、できれば改善点も知りたい…。そん …
2024/10/30(水)
オンラインセミナー「コンテンツのKPIと評価~GA4を使った効果分析~」|2024/10/30(水)
オウンドメディアを運営し、コンテンツマーケティングに取り組む企業が増えていますが、「どのように評価すればよいかわからない」「コンバージョンが …
【コラム】新しい生成AI検索サービス 効率的な答えが見つかることは本当に幸せか?
アナリティクスアソシエーション 大内 範行ChatGPT searchが、一部のユーザーにリリースされています。 私はTeamsプランで契約があるためChromeのデフォルトサーチに …
みなさんこんにちは。渋谷にある大学、日本経済大学で教員をしております、金谷武明と申します。以前はGoogleという会社でYouTubeで検索 …
衆議院選挙が終わりました。選挙のたびに開票の時刻と同時に当選確実が出る「出口調査」の予測が話題になります。 今回、開票と同時に出した主要メデ …