コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2021年7月21日号より
前回のコラムでは、「説明可能なAI(Explainable AI )」「解釈可能なAI(Interpretable AI)」が取り沙汰されて来ているということ、様々なベンダーから説明可能なAIがサービスとして提供され始めており、今後さらに研究が進んでいくだろうことをお話ししました。
今回は、解釈可能性・説明可能性を求める際のアルゴリズムのなかでも特に代表的に知られている手法についてご紹介したいと思います。識別・予測など機械学習の目的に対して求めた境界を線形近似することによってモデルを説明する「LIME」と、特徴量間での利得配分によって説明する「SHAP」の2つです。
LIME(local interpretable model-agnostic explanations)
LIMEは複数のモデルが組み合わさったり深層学習などで得られた機械学習のモデルを線形回帰で近似することにより解釈しようと試みるアプローチです。いくつかのデータサンプルと、その周囲のデータの空間でサンプリングと予測を繰り返し行い、生成されるデータセットを教師データとして線形回帰を行います。そこで得られた線形回帰モデルを解釈に用いるというわけです。モデルに寄与した特徴量とそのスコアが可視化できますので、様々なAIモデルに対して適用が可能で、画像やテキストデータを用いた解析にも応用されています。
しかし、これはある特定のデータの空間でのみ有効な線形回帰モデルであることはわすれてはなりません。サンプリングされたものと周囲の空間のみでのモデルなので、極めて局所的なものであるということを押さえておく必要があります。また、アンサンブル学習やニューラルネットワークの多層の構造も線形ではありませんので、そこにも注意が必要です。
SHAP(SHapley Additive exPlanations)
SHAPは「協力ゲーム理論」におけるShapley値を利用して各説明変数の寄与を説明しようとするアプローチです。協力ゲーム理論は、ゲームにおいて複数のプレイヤーが協力して勝利を目指すときの各々のプレイヤーの利得と振る舞いを考えるゲームです。これを応用し、それぞれの特徴値がモデルにどう影響を与えたかを算出するものです。特定の変数の値の「増減」が与える影響を可視化できるため、変数の寄与度を捉えることが可能です。LIMEと同様、非構造化データの処理にもよく使われています。画像の検知などではどの領域の特徴を重視したのかを捉えるために活用されています。
いずれも代表的な手法で、現在は他にも様々なものが開発されてきています。しかしいずれも元のモデルへの理解とインプットデータへの理解を伴うものであることを忘れずにいたいですね。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2025/09/10(水)
オンラインセミナー「手間ゼロの広告レポーティングを「Looker Studio」×「Databeat」で実現する方法」|2025/9/10(水)
ツール研究会の2回目は、Databeatがテーマです。 広告データの収集から蓄積・レポート作成までを自動化できる「Databeat」の活用方 …
2025/08/27(水)
オンラインセミナー「GA4のセグメントで分析が変わる!探索レポート活用術」|2025/8/27(水)
このセミナーでは、Google アナリティクス 4(GA4)をより実践的に使いこなすために探索レポートのセグメント機能を基礎から活用術まで学 …
2025/07/16(水)
オンラインセミナー「【Canva入門 for マーケ担当者】広告・解析レポートをサクッと伝わるデザインにしてみよう!」|2025/7/16(水)
2025年スタートの新企画「ツール研究会」の第一弾は、「Canva」を取りあげます。 急なバナー作成やCTA差し込み、レポート用スライド作成 …
【コラム】生成AI時代、独自性・原体験をどうコンテンツに組み込んでいくのか
株式会社A-can 白砂 ゆき子生成AIが業務に浸透することで、コンテンツ制作におけるリソース配分は大きく変わりました。以前は原稿執筆の作業時間が最も長く、次に構成、そして …
【コラム】国家の統計データは、羅針盤であり内視鏡であり私たちの鏡です
アナリティクスアソシエーション 大内 範行8月1日に米国で発表された雇用統計で、過去の就業者数が大幅に下方修正されたことがニュースで話題になりました。 「いくらなんでも変わりすぎ」と …
仕事をする上で、ピントを合わせることを大切にしている。 筆者はカメラマンではないが、普段料理や愛猫の写真をよく撮る。オートフォーカス機能のお …