コラムバックナンバー
アナリティクスアソシエーション 大内 範行
メールマガジン2017年8月23日号より a2i代表 大内 範行
ベイズ統計の自己学習をしてみたので、その振り返りです。
もちろん、少し先の未来は、機械学習やベイズ統計学など小難しいことを知らなくても、ツールが賢く解決してくれる世界があります。
現にベイズ推定の理論を知らなくても、それを使ったA/Bテストツールを使えますし、機械学習の仕組みを知らなくてもそれを使ったリマーケティングは活用できます。正直、中身がブラックボックスのままでも、生きていくのに何の心配もいりません。とはいえ、ここ数年、繰り返し「機械学習」や「ベイズ」という言葉を見聞きしながら、まったく何も知らない、というのも居心地が悪いものです。
そこで「ベイズ統計」について、基本を学ぼうとウェブの探索と、いくつかの書籍を手に取ってみました。どうせなら、ということで8冊の書籍に目を通してみました。4冊が基本を理解できるといううたい文句の書籍で、残り4冊がエクセルやR言語で実践する、というタイプの書籍です。
まず前提として、私自身は文系出身ですので、数学は得意ではありません。
従来の統計で使用している重回帰分析ぐらいまでは、ウェブの記事を拾い読んでいけば、エクセルやR言語で取り組むことができました。
しかし、ベイズ統計についてはこれまでの一般的な統計と発想が違うためか、いくつかウェブの記事を読んでもなかなか理解ができません。
改めて取り組んでみて、最初の第一歩、概念と用語を理解するところは、ウェブの情報よりは書籍の方が圧倒的に有効でした。
本当に基礎からということで一番のお薦めは以下の書籍でした。
■「図解・ベイズ統計「超」入門」 涌井 貞美 SBクリエイティブ
この書籍はいわゆるマンガ形式の本ですが、イラストと無駄な会話があるとはいえ、基本の考え方と用語、最後は少し発展的な学習まで網羅性があり、かつ小難しい数式をうまく避けて、ベイズ統計の考え方を説明しています。
著書の涌井 貞美氏は、涌井 良幸氏と夫婦で統計や機械学習の基礎の本を多く出版しているようです。多変量解析に関する書籍を見ても、同様にわかりやすかったので、最初の一歩はこの夫婦の本で間違いないかもしれません。
次のステップとして、以下のウェブサイトをご紹介します。
■「機械学習 はじめよう」 中谷 秀洋,恩田 伊織 gihyo.jp
サイボウズのデータサイエンティストの方と、フリーのプログラマの方が共同で書いているようです。後半になると本格的な数式が並びはじめますので、ついていけない箇所も多いのですが、ある程度読み飛ばしながらでも、機械学習とベイズ統計について、より広い世界が理解できます。すべてを理解するというよりは、いったん俯瞰し、躓いた箇所は検索しながら別の記事からつかんでいくとよいでしょう。
次にもやもやとしたままかもしれませんが、R言語と追加パッケージを使って、ベイズ統計を使ったモデリングにチャレンジしてみます。Rとベイズの書籍もいろいろ出ていますが、以下がもっとも実践的で手順を追いながら取り組めそうです。
■「Wonderful R2 StanとRでベイズ統計モデリング」 松浦 健太郎 共立出版
この書籍もすべてを読むというよりは、まず前半の単回帰分析と重回帰分析あたりを、一般的な方法とベイズ統計を使った方法で、それぞれ実践比較してみるのがよいでしょう。
あとは自分が達成したい目的を軸に、ウェブを検索しながら、実行できそうな記事を見つけてはトライしていく、という感じで進めていきます。
あまりレベルの高くない個人の学習経験ですが、本当に基礎を知る、という点ではやはりよい書籍に出会うのが早道のようです。
アナリティクスアソシエーション代表
個人情報保護士、専門統計調査士
日本アイ・ビー・エム、マイクロソフト、Googleなどを経験。Googleでは2011年から7年間、Googleアナリティクスとダブルクリック広告のマネージャなどを歴任。
2019年からはJellyfish 副社長 VP Analyticsとして参画し、2021年からはアユダンテ株式会社でCSOに就任。
並行して2008年から協議会「アナリティクスアソシエーション (a2i.jp)」代表としてデジタルマーケティングのデータ分析の普及に取り組んでいる。
仕事の傍SEOやアナリティクスの書籍も多数執筆。
主な著書『できる100ワザ SEO&SEM』、『できる100ワザ Google Analytics』、『SEM Web担当者が身につけておくべき新100の法則』など。
2025/09/10(水)
オンラインセミナー「手間ゼロの広告レポーティングを「Looker Studio」×「Databeat」で実現する方法」|2025/9/10(水)
ツール研究会の2回目は、Databeatがテーマです。 広告データの収集から蓄積・レポート作成までを自動化できる「Databeat」の活用方 …
2025/08/27(水)
オンラインセミナー「GA4のセグメントで分析が変わる!探索レポート活用術」|2025/8/27(水)
このセミナーでは、Google アナリティクス 4(GA4)をより実践的に使いこなすために探索レポートのセグメント機能を基礎から活用術まで学 …
2025/07/16(水)
オンラインセミナー「【Canva入門 for マーケ担当者】広告・解析レポートをサクッと伝わるデザインにしてみよう!」|2025/7/16(水)
2025年スタートの新企画「ツール研究会」の第一弾は、「Canva」を取りあげます。 急なバナー作成やCTA差し込み、レポート用スライド作成 …
【コラム】生成AI時代、独自性・原体験をどうコンテンツに組み込んでいくのか
株式会社A-can 白砂 ゆき子生成AIが業務に浸透することで、コンテンツ制作におけるリソース配分は大きく変わりました。以前は原稿執筆の作業時間が最も長く、次に構成、そして …
【コラム】国家の統計データは、羅針盤であり内視鏡であり私たちの鏡です
アナリティクスアソシエーション 大内 範行8月1日に米国で発表された雇用統計で、過去の就業者数が大幅に下方修正されたことがニュースで話題になりました。 「いくらなんでも変わりすぎ」と …
仕事をする上で、ピントを合わせることを大切にしている。 筆者はカメラマンではないが、普段料理や愛猫の写真をよく撮る。オートフォーカス機能のお …