コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年6月22日号より
日々の業務における資料作成や、DXの支援についての場面などにおいて様々なデータを参照するケースは皆様も多いと思います。私自身も自社で進めているデータ分析のプロジェクト、DX推進の支援などにおいて各種統計データや調査データに日々接しておりますが「データを入手するチカラ」は人によるバラツキが非常に大きいと感じています。特に公的機関が発表している統計情報やオープンデータについては発想が及ぶ方が多くないのではないかと感じており、これについてはどこかでしっかりと発信をしていく必要があるという危機感すら覚えています。こういった統計情報に対するアクセシビリティを高めるにはどうすれば良いのかを今回は考えてみました。
データにアクセスできる力とは
データサイエンティスト協会のスキルチェックリストでは、データ入手のスキルを下記のように定めています。
見習いレベル:仮説や既知の問題が与えられた中で、必要なデータにあたりをつけ、アクセスを確保できる
独り立ちレベル:自身が担当するプロジェクトやサービスを超えて、必要なデータのあたりをつけ、アクセスを確保できる
棟梁レベル:組織全体及び関連する社外のデータを見渡して、必要なデータのあたりをつけ、アクセスを確保できる
入手できるデータによって、その分析プロジェクトの成果は大きく左右されます。このスキルを獲得し、高めていくにはどのようにすればよいのでしょうか。
分析対象への理解-アウトラインを理解するための論文・白書の検索
必要なデータにアクセスするには、その分析対象の領域についての理解が不可欠です。いわばドメイン知識、それによる「土地勘」がなければ調べるためのキーワードやデータソースについて想定することも本来であれば叶いません。しかし、未知の領域に対応することも多くあるはずです。では、ドメイン知識がない場合はどうすればよいか-これは、そもそも”情報へのアクセス”にどのような方法があるか、代表的なものを知っておくということで対処できます。ここで意外と行われないのが学術論文、図書、政府の白書などの検索です。未知の領域でも初動としてこれらの情報ソースにアクセスする習慣を持っておくことで、分析しようとする課題のアウトライン、骨格をクイックにつかむことができるようになります。「Google検索だけにとどまらない(むしろやらない)」とも言えるかもしれません。
ドメイン知識の獲得方法については以前もコラムに寄稿しておりますので下記を参照ください。
【メルマガコラム】ドメイン知識を得るということ
代表的なデータソースとしては J-STAGE、Google Scholarが挙げられますが、ときとして機械判読化されていない情報もあります。それらは図書館OPAC(オンライン蔵書目録)などで検索してみると良いでしょう。
政府や民間企業の統計情報の活用
代表的なものとして下記のような情報ソースがあります
政府統計の総合窓口
日本の統計が閲覧できる政府統計ポータルサイトです。ただし注意が必要なのが、このサイトにない政府統計も数多あるということです。特に、基幹統計ではない各省庁による調査や白書の元データ、地方自治体などで収集されている統計情報はその対象となる自治体に直接問い合わせしたほうが早く手に入ります。
SSJDA(東京大学 社会科学研究所 附属社会調査・データアーカイブ研究センター)
学術利用を目的とした統計調査、社会調査データが公開されているサイトです。
株式会社リクルートのHPの「調査・データ」
転職、旅行、飲食などリクルート社の提供するサービスに関連した調査データを調べることのできるサイト
博報堂生活総研
生活定点調査のデータ。20数年分あり、社会の変化について概要を把握するときなどに役立ちます。
さて、実はデータへのアクセスに苦慮する方が多い一方で、世の中では適切に仮名化・匿名化されたデータや深層学習系の技術を用いて作成したミクロデータ(個票)を特に研究目的などで公開する動きも出てきています。いわば「データの民主化」と呼ばれる流れですが、次回は政府のミクロデータとデータ民主化などについて寄稿してみたいと思います。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2026/01/22(木)
オンラインセミナー「検索行動・消費者分析ツール「DS.INSIGHT」の最新機能と活用事例」|2026/1/22(木)
ツール研究会の3回目は、DS.INSIGHTがテーマです。 このセミナーは、どなたでも参加可能です。 一般の方の申込には、ライト会員(登録・ …
2025/12/03(水)
オンラインセミナー「GAの分析とモニタリングの適材適所ガイド― Looker Studio、探索、スプレッドシート、MCPサーバーの使い分け」|2025/12/3(水)
このセミナーでは、Google アナリティクス 4(GA4)のデータを効果的に活用するために、目的に応じた最適なレポート機能の選び方と使い分 …
2025/11/18(火)
【大型イベント開催】a2i秋の広告祭 デジタル広告の役割を再設計しよう|2025/11/18(火)
a2i秋の広告祭 デジタル広告の役割を再設計しよう デジタル広告のこれからを半日で学ぶ!豪華11名のスペシャリストが集結! デジタル広告のテ …
【コラム】生成AI時代 データ分析に必要な”料理人のスキル”は?
アナリティクスアソシエーション 大内 範行「生成AIでデータ分析は、どこまで簡単でおいしくなるのだろうか?」 今年最後のコラムです。来年に向けてそんなテーマを考えてみたいと思います。 …
【コラム】AIの活用が進む今だからこそ、デジタルに依存しすぎない視点を
Yuwai株式会社 田中 広樹a2i秋の広告祭が終わりました。ご参加いただいた方、ご登壇いただいた方、会場の運営をいただいた方皆さまに感謝を述べたいと思います。ありがとう …
【コラム】AI自動化が進むマーケティングの未来 あなたはどう生きるか? a2i秋の広告祭の実感
アナリティクスアソシエーション 大内 範行a2i秋の広告祭が終わりました。 この「a2i秋の広告祭」は、「祭」と銘打った割には極めてマジメなイベントでした。 このイベントを構想して、 …