コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年9月21日号より
2019年12月に世界で初めて新型コロナウイルスの感染者が報告されてから2年8ヶ月が経過しました。先日、WHOのテドロス事務局長がこのパンデミックの状況について「まだ到達していないが、終わりが視野に入ってきた」と発言したこともあり、様々なことが動き始める機運が高まっています。社会の変化に伴って分析するデータにも変化が現れることが予見されます。そして「コロナ禍」と位置づけられる期間のデータの振る舞いを、今後は考慮して分析に臨まなくてはなりません。
入るはずのない値の混入、代表値からかけ離れたデータ、あるいはデータが存在しない、さらにそれが「長期間」もしくは「何度も繰り返す」といった状況は、皆様が解析されるデータの殆どで起きているのではないかと思います。
コロナ禍以外にも、時系列データの解析において押さえておくべき要因は多数ありますが、下記のようなスタンダードなものは(分析する対象のテーマにもよりますが)まず最初に考慮を検討するべき要因です。
・曜日、週、月、祝祭日、季節
・五十日、月末月初、月内最終金曜日
・イベント(ライブやコンサートの開催、バレンタイン、クリスマスなど)
・降水量や日照時間、気温・湿度などの天候
・人流
これらに加えて(もちろん、どちらがトリガーかというよりは互いに影響しあっているケースがほとんどですが)、コロナの陽性者数の推移や、各地域・自治体の単位で行われた行動制限を伴う感染症対策の施策の実施についても、時系列データの要因把握には基本的な分析として保持しておいて良いと考えています。コロナの陽性者数のデータは世界中の数値が公開されており容易に入手できますので、上記のスタンダードなもの以外に継続取得して要因特定に役立てるという体制は整えておくことをオススメします。
そのほかにも時系列データを扱う際に気に留めておきたいのが災害や通信障害、システム障害など「何らかのトラブル」の記録です。これらには曜日やイベントと違って規則性が無いことが多く、また発生も稀であることから継続して記録され、蓄積されている情報はあまり多くありません。災害がいつ起きたか、その被害がどの程度であったかということは災害事例データベースに約6万件のデータが存在していますが、今後は災害時の人の行動履歴や位置情報なども集約されるようになることを期待しています。データの粒度は細かく、リアルタイム性を保持して記録されていくと、なお活用に広がりがもたらされると思います。
コロナや災害等のデータは公開される情報である程度データが揃いそうですが、事業者は可能であれば自社にとってネガティブなことが起きた情報を1st Partyデータとして記録しておくと良いと私は考えています。クレームやSNSの炎上、通信障害やシステム障害などの記録です。一方、システム障害真っ最中はその記録が出来ませんので、それ自体に備える必要もあります。
データは何かが起きた結果として分析者の手元にやって来ます。何かが「起きていない」結果でもあります。「いつ・なにが・どこで起きたか」の把握は時系列データ分析の基本ですが、分析対象への理解と世の中のあらゆる事象の概要を知っておくことが求められます。結局のところ、分析者、データサイエンティストは「イケてるビジネスパーソン」であることに他ならないのかもしれません。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2026/03/18(水)
オンラインセミナー「GA4×生成AIで改善提案の精度を高める ― AIから「使える施策」を引き出す実践アプローチ ―」|2026/3/18(水)
GA4によるサイト改善は、生成AIと組み合わせることで新しい段階に入りつつあります。 しかし一方で、「AIに分析させても表面的なコメントしか …
2026/02/19(木)
オンラインセミナー「GA4×ヒートマップで成果を出すCVR改善入門」|2026/2/19(木)
本セミナーは、Google アナリティクス 4(GA4)とヒートマップを活用してCVR改善の施策設計と効果検証を再現性高く行うための実践的な …
2026/01/22(木)
オンラインセミナー「検索行動・消費者分析ツール「DS.INSIGHT」の最新機能と活用事例」|2026/1/22(木)
ツール研究会の3回目は、DS.INSIGHTがテーマです。 このセミナーは、どなたでも参加可能です。 一般の方の申込には、ライト会員(登録・ …
【コラム】生成AIは「飼い主」を選ぶ──GA4×生成AIで「使える施策」を引き出すために
アナリティクスアソシエーション 大内 範行生成AIに仕事をさせてみたものの、表面的なコメントしか出てこなかった──そんな経験をお持ちの方も多いのではないでしょうか。 「プロンプトが悪 …
【コラム】2026年以降も生き残るであろうアクセス解析業務とは?
株式会社MOLTS/株式会社月曜日のトラ 西 正広こんにちは、月曜日のトラの西です。 私は2006年に社会人となり、社会人1年目からアクセス解析ツールに触れてきました。2026年は、私がアク …
【コラム】生成AIはデータ分析をどう変えていくのか?自動運転レベルに学ぶ3段階の進化へ
アナリティクスアソシエーション 大内 範行2026年が明けました。今年は「生成AIを使ったデータ分析」が、大きなテーマになりそうです。 年初のコラムですし、まずは少し広い視野で、デー …