コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年11月16日号より
前回のコラムでは、分析プロジェクトの進行時に依頼主やプロジェクトのステークホルダーに分析アプローチを提示することの重要性について寄稿しました。使用するデータセットや期間、処理手順、モデリングの方針、評価方法など分析のプロセスを明らかにしたものを提示することで、追加要望や手戻りを防ぐことができます。今回はこのアプローチ設計、分析計画書に必要な要素について記載したいと思います。
私は自身の携わるプロジェクトでは、この計画書をデータの取得から詳細なモデリングに入る前(依頼主からデータセットを受け取り基本分析が終わった後、データの構造を確認した後)のタイミングで提示することがほとんどです。そもそものプロジェクトの大枠のプロセス提示はプロジェクトの提案時やキックオフ時に行われると思いますが、「分析のモデリングや具体的な仮説検証に入る前に」提示するものとしてご確認ください。
– 用いるデータセット
分析に用いるデータセットの一覧とその項目および期間、取得前であれば取得方法と場合によっては権利関係について言及します。
– データの処理工程・処理プロセス手順
取得→前処理・クリーニング→単変量解析・分布の把握→相関の把握→モデリング→評価という基本プロセスをデータセットの名前などを用いながら言及します。ときにはいわゆる「前処理」のポリシーや変数のくくり方、特徴量設計についてのポリシーも提示しても良さそうです。
– モデリングに用いる変数・特徴量の候補
事前に立てた仮説に対し”あたり”のついている変数や特徴量は記載をします。この時点で過不足が無いかの確認に用いることができるため、以降の進行をスムーズにすることができます。
– 想定されるモデリング手法
予測・識別・分類・パターン発見などプロジェクトの目的によって用いる手法は様々ですが、想定される手法は提示します。また可能な限りその手法のメリット・デメリット、性能についても言及できると依頼元の期待値を適切にコントロールすることができます。
– モデルの評価方法および評価指標の提示
計画書でも最も重要なのが評価方法と指標の提示です。用いるモデルによって評価指標も異なりますので、モデリング手法と対で構成した資料にすることも多いです。
– 分析結果イメージの提示
必ずしも必須ではありませんがアウトプットイメージがあると議論も調整も行いやすくなります。用語だけでも分析対象テーマや収集データからキーワードを用いたイメージを提示できるとよいでしょう。
大切なことは”データの構造を把握したうえでの方針提示”であるということです。分析プロジェクトのハンドリングは前回言及した契約の種別により大きく左右されますが、どのような場合であってもデータを元にした意思決定に徹すればハンドリングに苦慮することも少なくなるはずです。上記の計画書はあくまで私の用いている方法ですが、プロジェクトの規模に関わらず分析のプロジェクトを請け負う方には参考にしていただければ幸いです。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2026/03/18(水)
オンラインセミナー「GA4×生成AIで改善提案の精度を高める ― AIから「使える施策」を引き出す実践アプローチ ―」|2026/3/18(水)
GA4によるサイト改善は、生成AIと組み合わせることで新しい段階に入りつつあります。 しかし一方で、「AIに分析させても表面的なコメントしか …
2026/02/19(木)
オンラインセミナー「GA4×ヒートマップで成果を出すCVR改善入門」|2026/2/19(木)
本セミナーは、Google アナリティクス 4(GA4)とヒートマップを活用してCVR改善の施策設計と効果検証を再現性高く行うための実践的な …
2026/01/22(木)
オンラインセミナー「検索行動・消費者分析ツール「DS.INSIGHT」の最新機能と活用事例」|2026/1/22(木)
ツール研究会の3回目は、DS.INSIGHTがテーマです。 このセミナーは、どなたでも参加可能です。 一般の方の申込には、ライト会員(登録・ …
【コラム】生成AIは「飼い主」を選ぶ──GA4×生成AIで「使える施策」を引き出すために
アナリティクスアソシエーション 大内 範行生成AIに仕事をさせてみたものの、表面的なコメントしか出てこなかった──そんな経験をお持ちの方も多いのではないでしょうか。 「プロンプトが悪 …
【コラム】2026年以降も生き残るであろうアクセス解析業務とは?
株式会社MOLTS/株式会社月曜日のトラ 西 正広こんにちは、月曜日のトラの西です。 私は2006年に社会人となり、社会人1年目からアクセス解析ツールに触れてきました。2026年は、私がアク …
【コラム】生成AIはデータ分析をどう変えていくのか?自動運転レベルに学ぶ3段階の進化へ
アナリティクスアソシエーション 大内 範行2026年が明けました。今年は「生成AIを使ったデータ分析」が、大きなテーマになりそうです。 年初のコラムですし、まずは少し広い視野で、デー …