コラムバックナンバー
メールマガジン2014年3月25日号より 石井 陽子
グラフや表のチェックをしているとき、何故こんな簡単なミスに気づかなかったんだろうと思うようなことはありませんか?
無さそうでよく見られる集計のミスには以下のようなものがあります。
<ケース1> 表Aは構成比を表したグラフなのに全部の数字を足しあげたら100%になっていない。
<ケース2> 表Bと表Cの母数は同じはずなのに、母数が合っていない。
<ケース3> 表Dは顧客に満足度を10段階で評価してもらったときの評価点分布だが、1-3点を付けた人が8割超えている。
ミスをしないに越したことはありませんが、人間が作業を行えばミスは起こり得ます。ポイントは、ミスに気づけるかどうか。
最近は、データを集計・加工する人とデータを利用する(ために加工を依頼する)人で分業するというところが増えてきました。データが大きくなってきてそれを加工するまでに技術的な知識が必要になったり、そのための負荷も高くなっていますから、今後アウトプットまで全てを一人で(且つ人間だけで)完結するのはより難しくなるでしょう。(データが大きいところは、データを集計するという過程でも分業になりつつあります)
ですが、この分業によって冒頭に述べたような根本的(初段階で気づきそうな)なミスが発生しても気がつかないまま最後の最後まで進んでしまうということも、目につくようになりました。
この大きな要因の一つに、「データ集計や加工の作業を機械的に行い(行わせ)過ぎている」ということがあると思われます。
解決策を先の3つのケースに合わせて書いてみます。
まず、<ケース1>や<ケース2>の場合は、アウトプットしようとしているデータの「意味(イシュー)」を一緒に書き出すことでミスに気づきやすくなります。
たとえば、<ケース2>の場合、
表A 全社員の平均給与額
表B 全社員の平均有給休暇取得日数
といったように。
このように意味を書き出していれば、おのずと表Aと表Bの母集団は全社員であり、同じ数であるということが理解でき、仮に間違っていても見直しの時に気が付きます。
しかし、データ加工を依頼する人が仮に『シートXの平均値とシートYの平均値を出しておいて。』といった具合に依頼をしてしまうと、集計対象のデータが何かがわかっていないので、集計時に参照するデータが間違っていても気づきません。(母数が一緒になることすら想像できないからです)
<ケース3>については少々変化球で、その数値が妥当であるかを判断するために基準値やトレンドを用いて見直すというパターンです。
業種やビジネスモデルによって違うものの、アンケートに回答してくださるような顧客に満足度調査を行うと、分布のボリュームは高い点数を付けた方に寄る傾向があります。それが<ケース3>のように1-3点に8割を超える人が集まっていたとすると、「?」とその数値を疑って、もう一度参照元のデータを見に行ってみます。そうすると、参照元のデータが逆になっていたということが起きていたりすることがあります。
このように、通常だとこう見えるはずだが結果が違う。本当だろうか?という観点からデータを見直すには、データが何であるかをわかっていなければならないのです。
データを加工する人と、データを利用する(加工を依頼する)人。この2人がうまく連携するためには
・データを加工する人はデータの成り立ちを理解しようとすること(単なる数字の集合体で見ないこと)
・データ加工を依頼する人はお願いしようとしているデータが何で、何をしてもらいたいのか目的をはっきりさせること
一手間かかりますが、その後の工程はぐっとスムーズになるはずです。是非実践してみてください。
2026/03/18(水)
オンラインセミナー「GA4×生成AIで改善提案の精度を高める ― AIから「使える施策」を引き出す実践アプローチ ―」|2026/3/18(水)
GA4によるサイト改善は、生成AIと組み合わせることで新しい段階に入りつつあります。 しかし一方で、「AIに分析させても表面的なコメントしか …
2026/02/19(木)
オンラインセミナー「GA4×ヒートマップで成果を出すCVR改善入門」|2026/2/19(木)
本セミナーは、Google アナリティクス 4(GA4)とヒートマップを活用してCVR改善の施策設計と効果検証を再現性高く行うための実践的な …
2026/01/22(木)
オンラインセミナー「検索行動・消費者分析ツール「DS.INSIGHT」の最新機能と活用事例」|2026/1/22(木)
ツール研究会の3回目は、DS.INSIGHTがテーマです。 このセミナーは、どなたでも参加可能です。 一般の方の申込には、ライト会員(登録・ …
【コラム】生成AIは「飼い主」を選ぶ──GA4×生成AIで「使える施策」を引き出すために
アナリティクスアソシエーション 大内 範行生成AIに仕事をさせてみたものの、表面的なコメントしか出てこなかった──そんな経験をお持ちの方も多いのではないでしょうか。 「プロンプトが悪 …
【コラム】2026年以降も生き残るであろうアクセス解析業務とは?
株式会社MOLTS/株式会社月曜日のトラ 西 正広こんにちは、月曜日のトラの西です。 私は2006年に社会人となり、社会人1年目からアクセス解析ツールに触れてきました。2026年は、私がアク …
【コラム】生成AIはデータ分析をどう変えていくのか?自動運転レベルに学ぶ3段階の進化へ
アナリティクスアソシエーション 大内 範行2026年が明けました。今年は「生成AIを使ったデータ分析」が、大きなテーマになりそうです。 年初のコラムですし、まずは少し広い視野で、デー …