コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2019年11月13日号より
■分析・レポートの際にどんなクロス集計を作るのがいいのか?
おそらくみなさんがよく直面するであろうパズルです。
ある月のウェブサイトの全訪問者(N)が10000人で平均のCVRが1%だったとします。ヘルプページへの流入(セグメントAとします)が100人でCVRが10%、ソーシャルメディアからの流入(セグメントBとします)が1000人でCVRが3%。このときレポートでは「ヘルプページへの流入」「ソーシャルメディアからの流入」どちらのほうをより重要な知見として報告すべきのでしょうか?どちらのセグメントのほうが全体のコンバージョンに対するプラスの貢献度が大きいといえばいいのでしょうか?
この2つのクロス集計の比較になります。セグメントAは全体の平均に比べて10倍もの高いCVRをあげています。しかし100人しかいません。それに対してセグメントBでは平均の3倍のCVRでしかないですが、1000人いるセグメントです。セグメントAはCVRのかい離は大きいが、サイズは小さい。セグメントBはCVRのかい離は小さいものの、サイズが大きい。
トータルでこれらを比較するときには、全体に対するCV貢献のインパクトの大きさで評価する必要があるのです。この場合では総CV数100に対してセグメントAは10コンバージョン、セグメントBは30コンバージョンを生み出しています。全体の平均的なCVRからすると、セグメントAの大きさであれば1CV、セグメントBの大きさであれば10CV程度しか生まないことになります。全体的には本来この程度であるところを、セグメントAは9CVの上乗せ、セグメントBは20CVの上乗せをしているというわけです。つまり全体のCVに対する上乗せ貢献度はセグメントBのほうが大きいということになります。
ではセグメントCの大きさが200人でCVRが10%、セグメントDの大きさが1500人で2%のとき、セグメントCとDのどちらの貢献度が大きいでしょうか。セグメントCの上乗せCV貢献数は18で、セグメントDでは15になります。つまりセグメントCのほうが僅差で貢献度が大きいのです。
レポートで複数の比較軸でどちらを議論すべきか迷ったとき、いくつか報告すべきセグメント(というより比較軸)が検討材料にあがったとき、どれを選ぶべきか。どのような優先順位で報告すべきか。その指針としてこのような計算方法は覚えておくといいでしょう。そしてこれをアルゴリズムで実現するのが決定木分析という手法になります。
■決定木とは
決定木(decision tree)とは対象をツリー上に分岐させて、濃い集団と薄い集団に分けていくデータマイニングの手法です。分けられた集団はその中でさらに濃いものと薄いものに分割され・・・を繰り返していきます。
たとえばある店舗で来店人数1000人のうち100人が購入をしたとします。来店数3を境目に人数と購入率が大きく分かれるのでまずそこで全来店者を分割(木を分岐)させます。次に来店数が多いセグメントでは性別で分けると人数と購入率が大きく分かれるので、性別で来店者を分岐させます。これを繰り返すことで購入しやすいセグメントとしにくいセグメントを見出すことができます。同時に購入しやすい条件としにくい条件も明らかになります。
一つ一つの分岐自体はクロス集計そのものです。その時点で分割すべき対象を最も効果的に分割してクロス集計を作るのです。そして分割された集団に対してさらにクロス集計を繰り返していく原理です。ということで全体としてはクロス集計のお化けともいえる手法です。数多くの変数があっても、アルゴリズムを使うと変数をすべて考慮したうえで効率的な分割を実現することができます。これを使った分析が決定木分析です。
ルールベースのアウトプット(先の例でいうと来店回数や性別)が出る、ツリーという構造のわかりやすさから、さまざまなデータマイニングの手法の中で結果の可読性が最も高い説明に効果的な手法と言われています。ということで決定木は分析の本質を最もよく反映したデータマイニング手法の一つであるといえるのです。次回は分割のアルゴリズムに触れながら決定木を実際の分析に生かす方法を紹介します。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2023/04/20(木)
オンラインセミナー「GA4活用、分析改善と広告運用の現場から」|2023/4/20(木)
Google アナリティクス 4(GA4)の本格的な利用が始まる2023年です。ユニバーサル アナリティクスとは異なる仕様が多く、従来は容易 …
2023/03/16(木)
オンラインセミナー「ウェブ/アプリのUX戦略 データ分析と定性分析の絶妙なバランスは?」|2023/3/16(木)
データ分析をするとき「肌感」は重要なポイントです。 あなたがGA4などアクセス解析のデータを読み解きするとき、 対象のウェブ/アプリについて …
2023/03/10(金)
【ランチタイム開催】「2023年デジマ予測 キーワードマーケティング滝井さんに聞く 今後、検索はどうなるの? 」|2023/3/10(金)
セミナー・イベント名 【ランチタイム開催】「2023年デジマ予測 キーワードマーケティング滝井さんに聞く 今後、検索はどうなるの? 」 セミ …
【コラム】人間の思考はAIに置き換えられるのか、どのような思考が人間の価値として残るのか
株式会社真摯 いちしま 泰樹AI関連の技術的なトレンドの変化が大きく、もしかしたら私たちの思考の一部は価値を失うのかもしれないと思ったりもします。何について考えるのが人 …
知的な仕事において情報の収集は大切です。当然ですが正しい情報を収集することが必要で、誤った情報は掴まないようにしなくてはなりません。おそらく …
あるツイートに目が留まりました。つぶやいた主は、企業に向けたコンテンツ作成をビジネスにしている人のようです。 「品質の高いコンテンツを時間を …