【メルマガコラム】ベイズ統計の基本の基本を学ぶための書籍紹介

大内 範行 発信元:メールマガジン2017年8月23日号より a2i代表 大内 範行

ベイズ統計の自己学習をしてみたので、その振り返りです。
もちろん、少し先の未来は、機械学習やベイズ統計学など小難しいことを知らなくても、ツールが賢く解決してくれる世界があります。
現にベイズ推定の理論を知らなくても、それを使ったA/Bテストツールを使えますし、機械学習の仕組みを知らなくてもそれを使ったリマーケティングは活用できます。正直、中身がブラックボックスのままでも、生きていくのに何の心配もいりません。

とはいえ、ここ数年、繰り返し「機械学習」や「ベイズ」という言葉を見聞きしながら、まったく何も知らない、というのも居心地が悪いものです。
そこで「ベイズ統計」について、基本を学ぼうとウェブの探索と、いくつかの書籍を手に取ってみました。どうせなら、ということで8冊の書籍に目を通してみました。4冊が基本を理解できるといううたい文句の書籍で、残り4冊がエクセルやR言語で実践する、というタイプの書籍です。

まず前提として、私自身は文系出身ですので、数学は得意ではありません。
従来の統計で使用している重回帰分析ぐらいまでは、ウェブの記事を拾い読んでいけば、エクセルやR言語で取り組むことができました。
しかし、ベイズ統計についてはこれまでの一般的な統計と発想が違うためか、いくつかウェブの記事を読んでもなかなか理解ができません。

改めて取り組んでみて、最初の第一歩、概念と用語を理解するところは、ウェブの情報よりは書籍の方が圧倒的に有効でした。
本当に基礎からということで一番のお薦めは以下の書籍でした。

■「図解・ベイズ統計「超」入門」 涌井 貞美 SBクリエイティブ

この書籍はいわゆるマンガ形式の本ですが、イラストと無駄な会話があるとはいえ、基本の考え方と用語、最後は少し発展的な学習まで網羅性があり、かつ小難しい数式をうまく避けて、ベイズ統計の考え方を説明しています。
著書の涌井 貞美氏は、涌井 良幸氏と夫婦で統計や機械学習の基礎の本を多く出版しているようです。多変量解析に関する書籍を見ても、同様にわかりやすかったので、最初の一歩はこの夫婦の本で間違いないかもしれません。

次のステップとして、以下のウェブサイトをご紹介します。

■「機械学習 はじめよう」 中谷 秀洋,恩田 伊織 gihyo.jp

サイボウズのデータサイエンティストの方と、フリーのプログラマの方が共同で書いているようです。後半になると本格的な数式が並びはじめますので、ついていけない箇所も多いのですが、ある程度読み飛ばしながらでも、機械学習とベイズ統計について、より広い世界が理解できます。すべてを理解するというよりは、いったん俯瞰し、躓いた箇所は検索しながら別の記事からつかんでいくとよいでしょう。

次にもやもやとしたままかもしれませんが、R言語と追加パッケージを使って、ベイズ統計を使ったモデリングにチャレンジしてみます。Rとベイズの書籍もいろいろ出ていますが、以下がもっとも実践的で手順を追いながら取り組めそうです。

■「Wonderful R2 StanとRでベイズ統計モデリング」 松浦 健太郎 共立出版

この書籍もすべてを読むというよりは、まず前半の単回帰分析と重回帰分析あたりを、一般的な方法とベイズ統計を使った方法で、それぞれ実践比較してみるのがよいでしょう。
あとは自分が達成したい目的を軸に、ウェブを検索しながら、実行できそうな記事を見つけてはトライしていく、という感じで進めていきます。

あまりレベルの高くない個人の学習経験ですが、本当に基礎を知る、という点ではやはりよい書籍に出会うのが早道のようです。


★メールマガジンのバックナンバーはこちら