コラムバックナンバー

前回のコラムではデータを入手する力とその重要性について寄稿しました。今回は意外と認知が低い「データの民主化」について少し触れます。データを公開し、社会に役立てられるよう整備する企業も増えてきました。今回は非常に有用なデータでありながら、あまり広く知られていない「統計ミクロデータ」についてお話ししたいと思います。

ミクロデータとは、集計処理されていない個々のデータ、個票のことを言います。日本国内で実施される多種の統計調査には当然ですが個票が存在しており、匿名加工されたものが総務省統計局により提供されており、手続きをすることによって加工・集計、分析し学術研究や教育の場面、社会貢献活動などに活用することができます。

ミクロデータ利用ポータルサイト

匿名加工データとして提供されている統計調査は下記のとおりです。

– 国勢調査
– 全国消費実態調査
– 社会生活基本調査
– 就業構造基本調査
– 住宅・土地統計調査
– 労働力調査
– 国民生活基礎調査

国勢調査はいわゆる全数調査ですから、これだけで約4800万件の世帯のデータが入手できることになります。過去4回分が提供されていますので、これだけでもかなりの容量のデータです。

匿名加工データとしての提供の他に「オーダーメイド集計」という提供方式もあります。これは利用者が集計項目を既存の分類項目から選択して申請することで、統計データの所管官庁が集計・作成し、提供するものです。手数料が必要ではありますが、提供されているデータは匿名加工データ以上に幅広いデータが用意されています。総務省データ利活用センターや一部の大学には、調査票情報をそのまま扱うことのできるオンサイト施設もあります。

オンサイト利用可能な施設一覧

日本国では様々な統計データが取得されておりそれがこのように個票で提供されているのは素晴らしいことです。とはいえ、実はこれらのデータが公開されており国民が広く活用することができる、というのはあまり知られていないようです。日本国内の様々な状況を捉えることのできる、この個票データの活用が、あらゆる分野、とりわけ社会課題の解決には大いに期待できるものであるはずです。

しかし、これら国が実施する基幹統計などの調査データだけでは社会課題の解決には不十分です。2022年現在、高校でのデータサイエンスの教育も始まり、データの利活用は今後さまざまな産業の発展、地域課題の解決に役立てられるはずですが、国が実施する統計調査以外のデータについてはその統合管理やこのような形での提供にまだまだ課題がある状況です(都道府県単位ではデータが存在していても、市区町村単位で取得されているケースは少ない、あるいは統計処理されたデータすら公開されていない)。こういったミクロデータの取り扱いスキルがない、ということも理由として挙げられるかもしれません。日本国内におけるデータサイエンス力の底上げは教育の場面から変わり始めましたが、行政や社会課題の解決におけるデータの利活用については、リスキリングやリカレント教育などにその役割が期待できるのではと思います。

コラム担当スタッフ

菅 由紀子

株式会社Rejoui
代表取締役

株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

バックナンバー一覧へ