コラムバックナンバー
メールマガジン2013年4月16日号より 真摯 いちしま泰樹
データの分析を始める際、明らかに対象外のデータや不要な情報を取り除くなど、データを整えるという「クリーニング」から作業は始まります。
例えば、自由記述のリサーチデータを扱う際、データは意外に混沌としていて、無効データの除去、重複データの取りまとめ、表現や形式の統一やグルーピングといった作業が必要です。
アクセス解析でもデータを扱う以上、データを整えるという側面では同じことが必要です。しかし、アクセス解析ツールの導入設定時に「適切なデータにする」という部分が意識されたものは非常にまれであると、経験上感じます。
数年前にアクセス解析ツールを導入し、特に誰かが積極的に利用していたわけでもない状態でアクセス解析周辺の取り組みをご一緒させていただく際、計測されているデータが「とっちらかっている」ことが多くあります。
それまで「データを見ながらサイトを運用する」という点までなかなか意識が回らなかったわけですから、仕方はありません。一方で、「とりあえずデータを全部取っているので後でなんとかできるんでしょう?」「ツールのタグを設置するだけでよいと聞いていました」という地点から、一緒に山を登り始める(サイトを運用して改善していく)のはなかなかハードな取り組みです。
・「人」以外のアクセスが多くデータに混じっているかどうか
→必要に応じて検索エンジンのクローラーなどのアクセスの除去
・社内のアクセスが多いのかどうか
→必要に応じて特定IPアドレスの除外
・同一ページが別のページとして計測されうるのかどうか
→パラメータの扱いや、index.html「ありなし」のURL正規化
・取得しなければいけないデータは取得できているのかどうか
→POSTメソッドでのフォームの同一URL遷移や、PDFのダウンロードなど
サーバーの生ログを扱うタイプのツールでも、ビーコン型のツールでも、押さえておくべきポイントはそれほど大きく変わりません。もちろん、しっかりした分析をする際には別途データを整理したりまとめる作業も必要なのですが、導入時に「データにゴミが混じりにくい環境」を準備しておくのはとても大事なことです。
ゴミが多く混じっているデータをどれだけ見ても、出てきた結果はやはりゴミ混じりなのですから。
4月になり、新しい体制でサイト運用が始まったところも多いと思います。
「大事だとわかっていたけれども後回しになっていたアクセス解析と、これからしっかり取り組みたい」のであれば、「よし分析するぞ」ではなく、データがゴミだらけでないか、取得しなければいけないデータは取れているのか、改めてスタート地点としての整備をされた方が良いでしょう。
2023/06/15(木)
オンラインセミナー「【基礎と応用】Google タグマネージャーでGA4のタグを設定してみよう」|2023/6/15(木)
ユニバーサルアナリティクスの計測停止を目前にしてGA4への移行がまったなしとなりました。移行を機にGoogle タグマネージャーでのタグ管理 …
2023/06/07(水)
【ランチタイム開催】「クラシコムにおける「データ」とは?データ基盤の立ち上げと活用について」|2023/6/7(水)
セミナー・イベント名 【ランチタイム開催】「クラシコムにおける「データ」とは?データ基盤の立ち上げと活用について」 セミナー・イベント内容 …
2023/05/17(水)
オンラインセミナー「注目 Microsoft 広告とAI~デジタルマーケティングはどう変わるのか?」|2023/5/17(水)
2022年5月末に日本市場でローンチされたMicrosoft 広告が急速に浸透しています。 また、Microsoftは対話型AIを搭載した検 …
【コラム】BardとGPTに聞くAI時代のSEO 長尾キーワードが鍵?
アナリティクスアソシエーション 大内 範行前回の大内のコラムは、要点を伝えてChatGPTに書いてもらいました。今回はGoogle BardとChatGPTの両方の助けを借りながら書 …
a2iでのコラム連載が最後になるのですが、意外と忘れられがちな、でもデータの分析や活用のために重要な視点をおさらいします。普遍的なことから、 …
【コラム】アナリティクスの新時代:データ分析の課題にどう取り組むべきか?
アナリティクスアソシエーション 大内 範行※ このコラムは大内が趣旨をプロンプトに投げて、ChatGPT(GPT-4)が書いたものを微調整しました。また、題名はGPT-4が出した案を …