コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2020年8月5日号より
データは21世紀の石油とも言われ、データ×AIがまさに世の中を大きく変革させています。データを扱う領域には様々な立場がありますが、データマイニング(掘削)と呼ばれる領域もあるため、うまく例えているなと感じる昨今です。一方、クラウドサーバーのコストが劇的に下がった事により「なんでも良いから全て溜める」「ハードコピーをとにかくデジタル化して格納しておく」という活動が4~5年前流行っていましたが、現在のサーバーコストがもはや当然となった昨今は「データは見極めて取捨選択する」動きが活発になって来ており、StayHomeで断捨離というのはデータの領域も同じであると感じています。この潮流をデータダイエット、データ断捨離と呼ぶ方もおられますが、今回はそれに役立つ [ ROD ] という指標をご紹介したいと思います。
RODとは ”Return on Data” の略称で、そのデータからどのくらい価値(リターン)が得られるかという指標です。
(データから得られる利益 - データのコスト)÷ データのコスト
により求められます。マーケティングにおけるROI(Return On Investment)と類似した考え方です。時代、そして価値観が劇的に変化し、あらゆることが急激にデジタルシフトしていくなかにあって、データの取捨選択は目下さまざまな企業の大きな課題であり、この考え方も急速に広まってきています。
データから得られる利益の1つは、[活用することで利益を上げるもの] です。顧客の購買ログデータやマーケティング施策の実行履歴データなどはイメージしやすいものかと思います。また、それらの行動履歴データと組み合わせるマスタ情報もこれらに該当すると考えられます。
もう1つが [その組織での生産性を高めるもの] です。業務システムの稼働履歴や社員の勤怠などがわかりやすい例としては挙げられるかと思います。
データのコストとしては、データを保持しておくサーバーやデータセンターなどのハードや管理するための人件費、データにアクセスするためのソフトウェア、およびそれを駆使して分析するための人件費、分析専用ソフトウェアなどが挙げられます。
データの管理コストも下がり、分析専用ソフトも安くなってきましたが、IoTデバイスの普及、5Gの開始により取得できるデータの単位はより細かくなり、リアルタイムに取得されるため量は指数関数的に増加しています。そのため、それを処理するための分析基盤の保持には、これまでひたすらデータに勤しんだ企業にとっては大きなコストとなっています。これらを使いこなすデータ分析人材の人件費が高いことは言うまでもありません。
■価値を生むデータと必要データの見極め方法
では、どのようにして「価値を生むデータ」を見極めるか?ということについて気をつけるべきポイント挙げてみたいと思います。
1 目的に影響するかの仮説を洗い出す
目的を定めてデータを選定するのは分析プロジェクトの大前提ですが「捨てる」ときにおいてもこれは同様です。そもそもデータ蓄積時に「とにかくなんでも全量」溜めて来たのであれば、目的の再確認は必須です。企業の経営理念、事業の目的にとって「そのデータがどのように影響するのか」を、データのリレーション関係を把握したうえで検討できれば理想的です。
2 マスタ情報は要注意
行動履歴データに注意が向きがちで、属性情報やマスタ情報や洗い替えされるデータなどは見落とされがちです。これらが存在しないと、本来であれば有益な履歴情報がただの記号になってしまい、インサイトを得られないという事態になりかねず、慎重な判断が求められます。複数を組み合わせれば復元可能であれば、その限りではありませんが、その判断を行うためには課題そしてデータそのものへの深い理解が求められます。
管理コストの面から考えると、分析基盤に残すのは不要な情報を削ぎ落として必要最低限の項目のみを保持しておくことも求められます。断捨離、整理整頓をイメージするならば「必要なものを必要な分だけで見えやすくしておく(まさにインデックス)」といったところでしょうか。そして、同じく定期的にデータの断捨離を行えると、なお良いと思います。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2024/05/23(木)
オンラインセミナー「今日から使えるヒートマップ超入門 ~読み解き方、ページ改善~」|2024/5/23(木)
Microsoft ClarityやUser Heatなど無料で使えるツールもあり、気軽な感覚で導入が増えているヒートマップ。導入はしたもの …
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
【コラム】測定への執着によって大切なものを見落としていないか
Yuwai株式会社 田中 広樹初めましてのかたも、二度目まして以上のかたもこんにちは、Yuwai株式会社の田中と申します。 運用型広告のコンサルティングを主とし、事業主の …
【コラム】車座分析のススメ サイト改善のよいタスクチームが組めるか?
アナリティクスアソシエーション 大内 範行前回は「広告予算再考」と題して「どんぶり勘定のススメ」について書きました。ただ、状況が悪化しているとはいえ、それでも広告は各プラットフォーム …
【コラム】ユニバーサルアナリティクス より自由度が高くなったことによる GA4 の弊害
株式会社JADE 村山 佑介こんにちは、株式会社JADEの村山です。過去にはa2iのセミナーで数回、Googleアナリティクス についてのセミナー等に登壇をさせていただ …