コラムバックナンバー
アナリティクスアソシエーション 大内 範行
メールマガジン2017年8月23日号より a2i代表 大内 範行
ベイズ統計の自己学習をしてみたので、その振り返りです。
もちろん、少し先の未来は、機械学習やベイズ統計学など小難しいことを知らなくても、ツールが賢く解決してくれる世界があります。
現にベイズ推定の理論を知らなくても、それを使ったA/Bテストツールを使えますし、機械学習の仕組みを知らなくてもそれを使ったリマーケティングは活用できます。正直、中身がブラックボックスのままでも、生きていくのに何の心配もいりません。とはいえ、ここ数年、繰り返し「機械学習」や「ベイズ」という言葉を見聞きしながら、まったく何も知らない、というのも居心地が悪いものです。
そこで「ベイズ統計」について、基本を学ぼうとウェブの探索と、いくつかの書籍を手に取ってみました。どうせなら、ということで8冊の書籍に目を通してみました。4冊が基本を理解できるといううたい文句の書籍で、残り4冊がエクセルやR言語で実践する、というタイプの書籍です。
まず前提として、私自身は文系出身ですので、数学は得意ではありません。
従来の統計で使用している重回帰分析ぐらいまでは、ウェブの記事を拾い読んでいけば、エクセルやR言語で取り組むことができました。
しかし、ベイズ統計についてはこれまでの一般的な統計と発想が違うためか、いくつかウェブの記事を読んでもなかなか理解ができません。
改めて取り組んでみて、最初の第一歩、概念と用語を理解するところは、ウェブの情報よりは書籍の方が圧倒的に有効でした。
本当に基礎からということで一番のお薦めは以下の書籍でした。
■「図解・ベイズ統計「超」入門」 涌井 貞美 SBクリエイティブ
この書籍はいわゆるマンガ形式の本ですが、イラストと無駄な会話があるとはいえ、基本の考え方と用語、最後は少し発展的な学習まで網羅性があり、かつ小難しい数式をうまく避けて、ベイズ統計の考え方を説明しています。
著書の涌井 貞美氏は、涌井 良幸氏と夫婦で統計や機械学習の基礎の本を多く出版しているようです。多変量解析に関する書籍を見ても、同様にわかりやすかったので、最初の一歩はこの夫婦の本で間違いないかもしれません。
次のステップとして、以下のウェブサイトをご紹介します。
■「機械学習 はじめよう」 中谷 秀洋,恩田 伊織 gihyo.jp
サイボウズのデータサイエンティストの方と、フリーのプログラマの方が共同で書いているようです。後半になると本格的な数式が並びはじめますので、ついていけない箇所も多いのですが、ある程度読み飛ばしながらでも、機械学習とベイズ統計について、より広い世界が理解できます。すべてを理解するというよりは、いったん俯瞰し、躓いた箇所は検索しながら別の記事からつかんでいくとよいでしょう。
次にもやもやとしたままかもしれませんが、R言語と追加パッケージを使って、ベイズ統計を使ったモデリングにチャレンジしてみます。Rとベイズの書籍もいろいろ出ていますが、以下がもっとも実践的で手順を追いながら取り組めそうです。
■「Wonderful R2 StanとRでベイズ統計モデリング」 松浦 健太郎 共立出版
この書籍もすべてを読むというよりは、まず前半の単回帰分析と重回帰分析あたりを、一般的な方法とベイズ統計を使った方法で、それぞれ実践比較してみるのがよいでしょう。
あとは自分が達成したい目的を軸に、ウェブを検索しながら、実行できそうな記事を見つけてはトライしていく、という感じで進めていきます。
あまりレベルの高くない個人の学習経験ですが、本当に基礎を知る、という点ではやはりよい書籍に出会うのが早道のようです。
アナリティクスアソシエーション代表
日本アイ・ビー・エム、マイクロソフト、Google。Googleでは2011年から7年間、Googleアナリティクスのマネージャなどを歴任。その他、SEO会社起業や日本の事業会社のデジタルマーケティングに従事してきた。
2019年からはJellyfishにVP Analyticsとして参画。
並行して2008年から協議会「アナリティクスアソシエーション (a2i.jp)」代表としてウエブ分析の普及に取り組んでいる。
仕事の傍SEOやアナリティクスの書籍も多数執筆。
主な著書『できる100ワザ SEO&SEM』、『できる100ワザ Google Analytics』、『SEM Web担当者が身につけておくべき新100の法則』など。
また、仕事の傍ら、幕末 徳川慶喜についての小説も執筆出版している。
『ケイキ君と一緒!: 幕末 最後の将軍 徳川慶喜「もしも」の物語』
幕末沼 徳川慶喜よくある質問
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
2024/02/21(水)
オンラインセミナー「生成AI時代到来 今後のSEOのポイントを考える」|2024/2/21(水)
2023年は生成AI・SGE(Google Search Generative Experience)・Bardの登場、Bingの躍進など、 …
【コラム】車座分析のススメ サイト改善のよいタスクチームが組めるか?
アナリティクスアソシエーション 大内 範行前回は「広告予算再考」と題して「どんぶり勘定のススメ」について書きました。ただ、状況が悪化しているとはいえ、それでも広告は各プラットフォーム …
【コラム】ユニバーサルアナリティクス より自由度が高くなったことによる GA4 の弊害
株式会社JADE 村山 佑介こんにちは、株式会社JADEの村山です。過去にはa2iのセミナーで数回、Googleアナリティクス についてのセミナー等に登壇をさせていただ …
今回のテーマは、「【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義を」の続きです。顧客理解を深めることで …