コラムバックナンバー

グラフや表のチェックをしているとき、何故こんな簡単なミスに気づかなかったんだろうと思うようなことはありませんか?

無さそうでよく見られる集計のミスには以下のようなものがあります。

<ケース1> 表Aは構成比を表したグラフなのに全部の数字を足しあげたら100%になっていない。
<ケース2> 表Bと表Cの母数は同じはずなのに、母数が合っていない。
<ケース3> 表Dは顧客に満足度を10段階で評価してもらったときの評価点分布だが、1-3点を付けた人が8割超えている。

ミスをしないに越したことはありませんが、人間が作業を行えばミスは起こり得ます。ポイントは、ミスに気づけるかどうか。

最近は、データを集計・加工する人とデータを利用する(ために加工を依頼する)人で分業するというところが増えてきました。データが大きくなってきてそれを加工するまでに技術的な知識が必要になったり、そのための負荷も高くなっていますから、今後アウトプットまで全てを一人で(且つ人間だけで)完結するのはより難しくなるでしょう。(データが大きいところは、データを集計するという過程でも分業になりつつあります)

ですが、この分業によって冒頭に述べたような根本的(初段階で気づきそうな)なミスが発生しても気がつかないまま最後の最後まで進んでしまうということも、目につくようになりました。

この大きな要因の一つに、「データ集計や加工の作業を機械的に行い(行わせ)過ぎている」ということがあると思われます。

解決策を先の3つのケースに合わせて書いてみます。

まず、<ケース1>や<ケース2>の場合は、アウトプットしようとしているデータの「意味(イシュー)」を一緒に書き出すことでミスに気づきやすくなります。
たとえば、<ケース2>の場合、
表A 全社員の平均給与額
表B 全社員の平均有給休暇取得日数
といったように。

このように意味を書き出していれば、おのずと表Aと表Bの母集団は全社員であり、同じ数であるということが理解でき、仮に間違っていても見直しの時に気が付きます。

しかし、データ加工を依頼する人が仮に『シートXの平均値とシートYの平均値を出しておいて。』といった具合に依頼をしてしまうと、集計対象のデータが何かがわかっていないので、集計時に参照するデータが間違っていても気づきません。(母数が一緒になることすら想像できないからです)

<ケース3>については少々変化球で、その数値が妥当であるかを判断するために基準値やトレンドを用いて見直すというパターンです。

業種やビジネスモデルによって違うものの、アンケートに回答してくださるような顧客に満足度調査を行うと、分布のボリュームは高い点数を付けた方に寄る傾向があります。それが<ケース3>のように1-3点に8割を超える人が集まっていたとすると、「?」とその数値を疑って、もう一度参照元のデータを見に行ってみます。そうすると、参照元のデータが逆になっていたということが起きていたりすることがあります。

このように、通常だとこう見えるはずだが結果が違う。本当だろうか?という観点からデータを見直すには、データが何であるかをわかっていなければならないのです。

データを加工する人と、データを利用する(加工を依頼する)人。この2人がうまく連携するためには
・データを加工する人はデータの成り立ちを理解しようとすること(単なる数字の集合体で見ないこと)
・データ加工を依頼する人はお願いしようとしているデータが何で、何をしてもらいたいのか目的をはっきりさせること

一手間かかりますが、その後の工程はぐっとスムーズになるはずです。是非実践してみてください。

★メールマガジンのバックナンバーはこちら

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

バックナンバー一覧へ