コラムバックナンバー
メールマガジン2013年4月16日号より 真摯 いちしま泰樹
データの分析を始める際、明らかに対象外のデータや不要な情報を取り除くなど、データを整えるという「クリーニング」から作業は始まります。
例えば、自由記述のリサーチデータを扱う際、データは意外に混沌としていて、無効データの除去、重複データの取りまとめ、表現や形式の統一やグルーピングといった作業が必要です。
アクセス解析でもデータを扱う以上、データを整えるという側面では同じことが必要です。しかし、アクセス解析ツールの導入設定時に「適切なデータにする」という部分が意識されたものは非常にまれであると、経験上感じます。
数年前にアクセス解析ツールを導入し、特に誰かが積極的に利用していたわけでもない状態でアクセス解析周辺の取り組みをご一緒させていただく際、計測されているデータが「とっちらかっている」ことが多くあります。
それまで「データを見ながらサイトを運用する」という点までなかなか意識が回らなかったわけですから、仕方はありません。一方で、「とりあえずデータを全部取っているので後でなんとかできるんでしょう?」「ツールのタグを設置するだけでよいと聞いていました」という地点から、一緒に山を登り始める(サイトを運用して改善していく)のはなかなかハードな取り組みです。
・「人」以外のアクセスが多くデータに混じっているかどうか
→必要に応じて検索エンジンのクローラーなどのアクセスの除去
・社内のアクセスが多いのかどうか
→必要に応じて特定IPアドレスの除外
・同一ページが別のページとして計測されうるのかどうか
→パラメータの扱いや、index.html「ありなし」のURL正規化
・取得しなければいけないデータは取得できているのかどうか
→POSTメソッドでのフォームの同一URL遷移や、PDFのダウンロードなど
サーバーの生ログを扱うタイプのツールでも、ビーコン型のツールでも、押さえておくべきポイントはそれほど大きく変わりません。もちろん、しっかりした分析をする際には別途データを整理したりまとめる作業も必要なのですが、導入時に「データにゴミが混じりにくい環境」を準備しておくのはとても大事なことです。
ゴミが多く混じっているデータをどれだけ見ても、出てきた結果はやはりゴミ混じりなのですから。
4月になり、新しい体制でサイト運用が始まったところも多いと思います。
「大事だとわかっていたけれども後回しになっていたアクセス解析と、これからしっかり取り組みたい」のであれば、「よし分析するぞ」ではなく、データがゴミだらけでないか、取得しなければいけないデータは取れているのか、改めてスタート地点としての整備をされた方が良いでしょう。
2020/01/23(木)
ビジネス Google アナリティクス基礎講座 第3回 @ワイム貸会議室(御茶ノ水)|2020/1/23 (木)
「ビジネス Google アナリティクス基礎講座」は、年間3回開催する、初級者向けのシリーズセミナーです。毎回2人の講師が各テーマで講義を行 …
2019/12/04(水)
セミナー「Google検索の変遷と事業主&外部パートナーから見たSEOの過去・現在・未来 」@ワイム貸会議室(御茶ノ水)|2019/12/4 (水)
少し前まで「検索」と言えば Yahoo! や Google で知りたいことを検索する行為を指していましたが、最近では、行きたいお店を探す時は …
2019/12/04(水)
a2i 冬の交流会@御茶ノ水を開催します (2019/12/4)
セミナー・イベント情報 12月4日(水)に、アナリティクスアソシエーションの交流会を、御茶ノ水のテラス8890で開催します。はじめての方でも …
今年、あなたはどんな分析ツールに興味を持ち、触れてきましたか? 私自身を振り返ると、Google アナリティクスが新しくなったのでそちらをい …
前回のコラムにおいては、データサイエンティスト協会より発表された「データサイエンティスト スキルチェックリスト ver.3」についてご紹介い …
【コラム】「空・雨・傘」と「データとインフォメーションとインテリジェンスの違い」
株式会社真摯 いちしま 泰樹若い人たちや新しい人たちがこれから「分析+改善」の取り組みに向き合うとき、どうやって経験を積んでいけば良いのだろうか。あるきっかけでこの数か …