コラムバックナンバー
メールマガジン2013年4月16日号より 真摯 いちしま泰樹
データの分析を始める際、明らかに対象外のデータや不要な情報を取り除くなど、データを整えるという「クリーニング」から作業は始まります。
例えば、自由記述のリサーチデータを扱う際、データは意外に混沌としていて、無効データの除去、重複データの取りまとめ、表現や形式の統一やグルーピングといった作業が必要です。
アクセス解析でもデータを扱う以上、データを整えるという側面では同じことが必要です。しかし、アクセス解析ツールの導入設定時に「適切なデータにする」という部分が意識されたものは非常にまれであると、経験上感じます。
数年前にアクセス解析ツールを導入し、特に誰かが積極的に利用していたわけでもない状態でアクセス解析周辺の取り組みをご一緒させていただく際、計測されているデータが「とっちらかっている」ことが多くあります。
それまで「データを見ながらサイトを運用する」という点までなかなか意識が回らなかったわけですから、仕方はありません。一方で、「とりあえずデータを全部取っているので後でなんとかできるんでしょう?」「ツールのタグを設置するだけでよいと聞いていました」という地点から、一緒に山を登り始める(サイトを運用して改善していく)のはなかなかハードな取り組みです。
・「人」以外のアクセスが多くデータに混じっているかどうか
→必要に応じて検索エンジンのクローラーなどのアクセスの除去
・社内のアクセスが多いのかどうか
→必要に応じて特定IPアドレスの除外
・同一ページが別のページとして計測されうるのかどうか
→パラメータの扱いや、index.html「ありなし」のURL正規化
・取得しなければいけないデータは取得できているのかどうか
→POSTメソッドでのフォームの同一URL遷移や、PDFのダウンロードなど
サーバーの生ログを扱うタイプのツールでも、ビーコン型のツールでも、押さえておくべきポイントはそれほど大きく変わりません。もちろん、しっかりした分析をする際には別途データを整理したりまとめる作業も必要なのですが、導入時に「データにゴミが混じりにくい環境」を準備しておくのはとても大事なことです。
ゴミが多く混じっているデータをどれだけ見ても、出てきた結果はやはりゴミ混じりなのですから。
4月になり、新しい体制でサイト運用が始まったところも多いと思います。
「大事だとわかっていたけれども後回しになっていたアクセス解析と、これからしっかり取り組みたい」のであれば、「よし分析するぞ」ではなく、データがゴミだらけでないか、取得しなければいけないデータは取れているのか、改めてスタート地点としての整備をされた方が良いでしょう。
2023/02/15(水)
オンラインセミナー「エクセルを使ったはじめての統計解析」|2023/2/15(水)
本セミナーではエクセル(Googleスプレッドシートでも可)を使った統計解析の基本を学ぶことができます。 参加者には講師からサンプルデータの …
2023/01/18(水)
オンラインセミナー「Google アナリティクス 4 Q&A祭り」|2023/1/18(水)
皆さんのGoogle アナリティクス 4(GA4)に対する疑問を、エキスパートが解決していきます。 GA4に対して導入設定や活用方法もまだま …
2022/12/21(水)
オンラインセミナー「Looker Studio(旧データポータル)活用術~ GA4・SEO編 ~」|2022/12/21(水)
今年はGA4移行イヤーということで、多くのサイトでユニバーサルアナリティクスからGA4への移行が進んだことと思います。 ではこのGA4のデー …
ベストプラクティスやノウハウは、標準化したりアウトプットにまとめられたりすると徐々に陳腐化していきます。「自社独自のノウハウ」として同じ手法 …
【コラム】個人の行動をトラッキングする技術と、それを制限するITPなどの技術
Option合同会社 柳井 隆道Googleアナリティクスやアプリの行動履歴ログというのはつまるところ個人の行動をトラッキングしているわけです。今回はこの「個人の行動をトラ …
【コラム】学習済みAI:メルマガのテーマをChatGPTに聞いてみました
株式会社Rejoui 菅 由紀子昨年12月にローンチされたChatGPTが話題です。 ChatGPTは革新的なAIを生み出して世界中の注目を浴びているOpenAIによっ …