コラムバックナンバー

今年も総務省統計局主催の小学生向けの統計講座で講師を務めさせていただきました。統計とはなにかということをテーマに、身近な統計データや統計グラフの使い方について学ぶ講座で、生活の様々なところで役立てられている「統計」を学んで正しいデータの活用方法を身に着けることを目的として開催されています。毎回、小学生から大人顔負けの鋭い質問を受けるのですが、今年は「統計を学んでいる人と機械学習を学んでいる人はどちらがお給料高いですか?」という質問を受けました。小学生の発言に「機械学習」という言葉が出てきたことも驚きでしたし、率直なその質問にもたいへん驚きました(笑)。実はこのトピックは統計 vs 機械学習という構図でデータ利活用のビジネスパーソンの社会でも時々論じられることでもあり(学会でもベースが異なる先生方が熱く議論されているのを何度も拝見しています)、また、そのお子さんはPythonも学んでおられるとのことで、新たな世代を頼もしく感じた一幕でもありました。

統計と機械学習の違い

AIを開発する歴史とともに発展してきた機械学習が、AIブームとともに大きく取り沙汰されるようになって久しく、普及期を超えてすでに新たなる領域の議論が行われていると思いますが、機械学習をビジネスに適用することそのものは広く行われています。機械学習が取り沙汰されるようになった当初は「統計学と何が違うのか」「その手法は統計学でも古くから語られてきた手法である」といった指摘がよくされてきました。教師あり・教師なしの概念もかねてより統計の世界でも使われていた言葉ですし、データの性質や分布なども当然ですが共通しています。RやPython、SQLなどのプログラミングを実行してデータ処理や可視化を行う過程も当然ですが共通しています。非常によく似ている統計学と機械学習は、用語や手法の違いよりも「何を重視しているか」ということが立場として大きく違うというのが私の解釈です。

機械学習は解決志向 -予測・分類・識別・パターン発見-

機械学習はその実行後に「得られる結果」をとにかく追求し、その精度を高めていくことに重きを置いています。機械学習の目的は様々ですが、教師あり学習においては未来の値を予測することや、文字や画像を識別・検出すること、分類するモデルを作ることが目的です。教師なし学習においても、大量のデータを分類したりその中における共通のルールや法則性などのパターンを発見することを目的としています。その目的を達成させるためのデータの加工やパラメータのチューニングを繰り返し実行します。教師あり学習であっても、教師なし学習であっても、その組み合わせで実現するものであっても、追求するのはその結果得られたモデルで目的が解決できるかにフォーカスしているという印象です。当たればいいというのは乱暴な言い方ですが。

統計は仮説検証と原因追求志向 -背景や因果の追求-

統計学においても、実行することは機械学習と非常によく似ていますが、機械学習よりも「なぜそのような結果となるのか」「どの要因が大きく影響しているのか」を把握することに重きを置いています。また、定められた仮説に対しデータを取得して集計・加工し、モデリングを実行して要因を把握したり傾向を捉えて新たな仮説検証へとつなげ、そのサイクルを実行していくことで課題解決の精度を高めていくというアプローチをとります。課題解決へつなげていくという点では機械学習も共通していますが、その過程において原因追求を深めて行く立場であるというのは機械学習と異なる点です。「ブラックボックスであるAI(機械学習)」の世界において、説明可能性や解釈可能性が求められ、その手法に注目が集まっているこの2~3年の変化というのは、個人的には非常に興味深い変化であり、とりわけ統計的因果推論は近年とくに注意深く観察し、情報を得るようにしています。データの取得単位が細かくなっていく昨今、この領域の発展によって「現象の理由を説明すること」に重きをおく統計学は、より発展すると考えています。

結局大事なのは課題解決

立場の違いはありますが、どちらも「ビジネスにおける課題解決」へつなげていくために実行するものであることは違いありません。そして、それを行うためには対応する課題背景に対する正しい理解(データの取得背景への理解)、分析手法に対する正しい理解(手法の選択が行えること)、得られた結果に対する判断力とその後のアクション(解決策の提示)が行えなければ意味がありません。もっというと、統計や機械学習を使わずとも行える課題解決も多く存在するはずです。ビジネスにおける課題解決に、うまくデータを使いこなす人になってほしいということ、数理統計の基礎をしっかりと学び、機械学習も目的に応じて使い分けられるような大人になってほしいということを、質問くださった小学生にはお伝えしました。改めて私自身もよく考える機会となった、貴重な夏休みでした。

統計と機械学習の違いについてはTJO尾崎さんのブログが非常に詳しく説明されておりますので是非ご一読をおすすめ致します。
「統計学と機械学習の違い」はどう論じたら良いのか

コラム担当スタッフ

菅 由紀子

株式会社Rejoui
代表取締役

株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

バックナンバー一覧へ