コラムバックナンバー
メールマガジン2014年3月25日号より 石井 陽子
グラフや表のチェックをしているとき、何故こんな簡単なミスに気づかなかったんだろうと思うようなことはありませんか?
無さそうでよく見られる集計のミスには以下のようなものがあります。
<ケース1> 表Aは構成比を表したグラフなのに全部の数字を足しあげたら100%になっていない。
<ケース2> 表Bと表Cの母数は同じはずなのに、母数が合っていない。
<ケース3> 表Dは顧客に満足度を10段階で評価してもらったときの評価点分布だが、1-3点を付けた人が8割超えている。
ミスをしないに越したことはありませんが、人間が作業を行えばミスは起こり得ます。ポイントは、ミスに気づけるかどうか。
最近は、データを集計・加工する人とデータを利用する(ために加工を依頼する)人で分業するというところが増えてきました。データが大きくなってきてそれを加工するまでに技術的な知識が必要になったり、そのための負荷も高くなっていますから、今後アウトプットまで全てを一人で(且つ人間だけで)完結するのはより難しくなるでしょう。(データが大きいところは、データを集計するという過程でも分業になりつつあります)
ですが、この分業によって冒頭に述べたような根本的(初段階で気づきそうな)なミスが発生しても気がつかないまま最後の最後まで進んでしまうということも、目につくようになりました。
この大きな要因の一つに、「データ集計や加工の作業を機械的に行い(行わせ)過ぎている」ということがあると思われます。
解決策を先の3つのケースに合わせて書いてみます。
まず、<ケース1>や<ケース2>の場合は、アウトプットしようとしているデータの「意味(イシュー)」を一緒に書き出すことでミスに気づきやすくなります。
たとえば、<ケース2>の場合、
表A 全社員の平均給与額
表B 全社員の平均有給休暇取得日数
といったように。
このように意味を書き出していれば、おのずと表Aと表Bの母集団は全社員であり、同じ数であるということが理解でき、仮に間違っていても見直しの時に気が付きます。
しかし、データ加工を依頼する人が仮に『シートXの平均値とシートYの平均値を出しておいて。』といった具合に依頼をしてしまうと、集計対象のデータが何かがわかっていないので、集計時に参照するデータが間違っていても気づきません。(母数が一緒になることすら想像できないからです)
<ケース3>については少々変化球で、その数値が妥当であるかを判断するために基準値やトレンドを用いて見直すというパターンです。
業種やビジネスモデルによって違うものの、アンケートに回答してくださるような顧客に満足度調査を行うと、分布のボリュームは高い点数を付けた方に寄る傾向があります。それが<ケース3>のように1-3点に8割を超える人が集まっていたとすると、「?」とその数値を疑って、もう一度参照元のデータを見に行ってみます。そうすると、参照元のデータが逆になっていたということが起きていたりすることがあります。
このように、通常だとこう見えるはずだが結果が違う。本当だろうか?という観点からデータを見直すには、データが何であるかをわかっていなければならないのです。
データを加工する人と、データを利用する(加工を依頼する)人。この2人がうまく連携するためには
・データを加工する人はデータの成り立ちを理解しようとすること(単なる数字の集合体で見ないこと)
・データ加工を依頼する人はお願いしようとしているデータが何で、何をしてもらいたいのか目的をはっきりさせること
一手間かかりますが、その後の工程はぐっとスムーズになるはずです。是非実践してみてください。
2024/10/30(水)
オンラインセミナー「コンテンツのKPIと評価~GA4を使った効果分析~」|2024/10/30(水)
オウンドメディアを運営し、コンテンツマーケティングに取り組む企業が増えていますが、「どのように評価すればよいかわからない」「コンバージョンが …
2024/10/10(木)
オンラインセミナー「GA4でアプリ計測の基本 アクセス解析担当者向け」|2024/10/10(木)
GA4導入が進み、WebサイトをGA4で分析することに慣れてきた方が多いのではないでしょうか。 しかしアプリについては「まだ手を付けられてい …
2024/09/25(水)
オンラインセミナー「Microsoft Clarityで深める真のユーザー理解」|2024/9/25(水)
Microsoft Clarityを使っていますか? データ計測がこれまでより不十分になることが懸念されるなか、ユーザー理解に活用できるMi …
【コラム】最終的に固有名詞で指名検索されるにはどのようなコンテンツマーケティングに取り組むべきか、と考える
株式会社真摯 いちしま 泰樹生成AIの急速な展開にやや戸惑い気味です。普段の業務や調べ物に生成AIを利用する機会が増えましたが、コンテンツ制作やアウトプットの課程が変わ …
【コラム】ブラッド・ピットと阿部慎之助監督 どちらのデータ改善策が勝負強いのか?
アナリティクスアソシエーション 大内 範行巨人がリーグ優勝を果たしました。巨人は今年から阿部慎之助が原監督に代わって20代目の監督になりました。監督の最初のシーズンで、阿部慎之助監督 …
【コラム】ダッシュボード依存症からの脱却:データ活用で本当の価値を生み出す方法
Option合同会社 柳井 隆道データ基盤やCDP(顧客データプラットフォーム)を導入したものの、ダッシュボードを作るまで、データを見るだけで満足してしまう、燃え尽きてしま …