コラムバックナンバー

データの分析を始める際、明らかに対象外のデータや不要な情報を取り除くなど、データを整えるという「クリーニング」から作業は始まります。
例えば、自由記述のリサーチデータを扱う際、データは意外に混沌としていて、無効データの除去、重複データの取りまとめ、表現や形式の統一やグルーピングといった作業が必要です。

アクセス解析でもデータを扱う以上、データを整えるという側面では同じことが必要です。しかし、アクセス解析ツールの導入設定時に「適切なデータにする」という部分が意識されたものは非常にまれであると、経験上感じます。

数年前にアクセス解析ツールを導入し、特に誰かが積極的に利用していたわけでもない状態でアクセス解析周辺の取り組みをご一緒させていただく際、計測されているデータが「とっちらかっている」ことが多くあります。

それまで「データを見ながらサイトを運用する」という点までなかなか意識が回らなかったわけですから、仕方はありません。一方で、「とりあえずデータを全部取っているので後でなんとかできるんでしょう?」「ツールのタグを設置するだけでよいと聞いていました」という地点から、一緒に山を登り始める(サイトを運用して改善していく)のはなかなかハードな取り組みです。

・「人」以外のアクセスが多くデータに混じっているかどうか
→必要に応じて検索エンジンのクローラーなどのアクセスの除去

・社内のアクセスが多いのかどうか
→必要に応じて特定IPアドレスの除外

・同一ページが別のページとして計測されうるのかどうか
→パラメータの扱いや、index.html「ありなし」のURL正規化

・取得しなければいけないデータは取得できているのかどうか
→POSTメソッドでのフォームの同一URL遷移や、PDFのダウンロードなど

サーバーの生ログを扱うタイプのツールでも、ビーコン型のツールでも、押さえておくべきポイントはそれほど大きく変わりません。もちろん、しっかりした分析をする際には別途データを整理したりまとめる作業も必要なのですが、導入時に「データにゴミが混じりにくい環境」を準備しておくのはとても大事なことです。

ゴミが多く混じっているデータをどれだけ見ても、出てきた結果はやはりゴミ混じりなのですから。

4月になり、新しい体制でサイト運用が始まったところも多いと思います。
「大事だとわかっていたけれども後回しになっていたアクセス解析と、これからしっかり取り組みたい」のであれば、「よし分析するぞ」ではなく、データがゴミだらけでないか、取得しなければいけないデータは取れているのか、改めてスタート地点としての整備をされた方が良いでしょう。

★メールマガジンのバックナンバーはこちら

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

  • 【コラム】ウェブ解析における「離脱」という行動

    Option合同会社 柳井 隆道
    発信元:メールマガジン2019年8月21日号より

    ウェブ解析でよく出てくる概念として「離脱」があります。この離脱とは一体何のことを指すのでしょうか? 大まかにいえばウェブサイトを訪問し、何ペ …

  • 【コラム】日本人の評価が辛いぞ問題

    アナリティクスアソシエーション 大内 範行
    発信元:メールマガジン2019年8月7日号より

    アマゾンはじめ商品レビューやレストランのレビュー、あるいは満足度調査の評価について、日本が他の国に比べて点数が低くなる傾向がある。そのような …

  • 【コラム】データサイエンティストスキルチェックリスト見直しに際して

    株式会社Rejoui 菅 由紀子
    発信元:メールマガジン2019年7月31日号より

    データサイエンティスト協会スキル定義委員として、スキルチェックリストおよびタスクリスト見直しを行っています。本リストでは、データサイエンティ …

バックナンバー一覧へ