コラムバックナンバー
株式会社ALBERT 浜田 和美
発信元:メールマガジン2018年4月25日号より
前回(「分析プロセスを知りたいならAIは適さない」2018年3月28日号)に続き、AIについて記します。
無事AI・人工知能 EXPOが終了しました。去年に比べEXPO全体の展示面積が広くなりましたので、満員電車のような人混みは解消されましたが、おかげさまで休憩がなかなか取りづらいほど来場者がいらっしゃいました。EXPO全体の来場者数は去年より約5千人多い46,323人でした。
去年の問い合わせの色合いから大きな変化はありませんでしたが、想定していた以上にAIそのものに関する情報収集は引き続き多かったこと、専門部署を設立したもしくは上司からトップダウン方式でAI化できるネタを探していらっしゃる方が増えた、という点が印象的でした。
興味がありましたら去年のレポートもあわせてご覧ください。
「AI・人工知能EXPO 出展レポート」
EXPOでは、AIはまだまだ万能ではなく向き不向きがあることをミニセミナーでご紹介してきました。向き不向きの視点で手配するデータも考える必要はあります。ブースでもAIを実現するために必要なデータについて質問いただきました。
そこで今回はAIに適したデータの一例をご紹介します。
====
・特徴量が捉えやすい
・充分な量のデータが保持されている
・多様性をカバーしたデータセットがある
====
・特徴量が捉えやすい
今までであれば人力で特徴を決める必要がありました。例えば体重を予測する場合に使ったものは「身長」であるといった特徴です。AIは「機械が特徴量を決めてくれる」という点がメリットとして挙げられますので、特徴量が多いデータ、例えば画像や音声データなどで力を発揮します。
・データが充分な量を保持されている
「人が捌ききれないほど膨大な量のデータがあるからAIにおまかせする」という発想からすると、AIに学習させるためのデータ量が少なすぎる場合はAIが不向きであるケースが多いです。では「データ量がどれぐらいあれば『充分』と言えるか?」と質問されることもありますが、ケースバイケースではありますが大体1,000件ほどのデータが必要であると回答させていただくことが多いです。
・多様性をカバーしたデータセットである
特徴量が捉えやすい種類のデータが膨大にあったとしても、極端な話、全て同じ特徴を持ったデータしかない場合、特徴を見出すことができません。例えば異常検知を行いたいのであれば、異常データと正解データ両方を保持したデータセットを用意する、明日の天気を予測したい場合は、様々な条件の天気データを用意するなどが必要です。
これらがAIに適したデータの特徴と考えますが、そうは言ってもAIに使用したいデータはなかなか集まらず、学習用データの作成がコストとして問題になることが多くあります。これら問題に対処するため、少量のラベルありデータしかなくても大量のラベルなしデータを活用して学習させる「半教師あり学習」という手法を活用する案件も出てきました。
またハッキングなどの不正な動きに対処するしくみ作りにAIを活用する場合、該当する異常データは不正操作をしたデータですが日常的にハッキングする人はなかなかいません。そのため正解データのみで「正解」を定義し、正解の定義に著しくそぐわないデータを異常とする手法を取るなどでカバーすることもできるようになりました。
ただ「餅は餅屋」の概念で、AIに任せたほうが良いケース、AIじゃないほうが良いケースなどがございますので、目的や使用するデータに応じてAI活用を検討いただくことをオススメします。
レコメンドエンジンや感性検索システムなど様々な新規サービスの企画・導入・運用に従事。
2012年、デジタル広告部門新設に伴い異動。実験計画法を用いたクリエイティブ最適化やダイナミックリターゲティングバナーの導入・運用、営業支援、メディアプランニングに携わる。
現在はコンサルタントとして旅行会社や食品メーカー等のクライアントを担当。プライベートDMPの導入・運用支援ならびに、広告部門時代の知見を活かしDMPを用いた広告施策のプランニングも実施。
2026/03/18(水)
オンラインセミナー「GA4×生成AIで改善提案の精度を高める ― AIから「使える施策」を引き出す実践アプローチ ―」|2026/3/18(水)
GA4によるサイト改善は、生成AIと組み合わせることで新しい段階に入りつつあります。 しかし一方で、「AIに分析させても表面的なコメントしか …
2026/02/19(木)
オンラインセミナー「GA4×ヒートマップで成果を出すCVR改善入門」|2026/2/19(木)
本セミナーは、Google アナリティクス 4(GA4)とヒートマップを活用してCVR改善の施策設計と効果検証を再現性高く行うための実践的な …
2026/01/22(木)
オンラインセミナー「検索行動・消費者分析ツール「DS.INSIGHT」の最新機能と活用事例」|2026/1/22(木)
ツール研究会の3回目は、DS.INSIGHTがテーマです。 このセミナーは、どなたでも参加可能です。 一般の方の申込には、ライト会員(登録・ …
【コラム】生成AIは「飼い主」を選ぶ──GA4×生成AIで「使える施策」を引き出すために
アナリティクスアソシエーション 大内 範行生成AIに仕事をさせてみたものの、表面的なコメントしか出てこなかった──そんな経験をお持ちの方も多いのではないでしょうか。 「プロンプトが悪 …
【コラム】2026年以降も生き残るであろうアクセス解析業務とは?
株式会社MOLTS/株式会社月曜日のトラ 西 正広こんにちは、月曜日のトラの西です。 私は2006年に社会人となり、社会人1年目からアクセス解析ツールに触れてきました。2026年は、私がアク …
【コラム】生成AIはデータ分析をどう変えていくのか?自動運転レベルに学ぶ3段階の進化へ
アナリティクスアソシエーション 大内 範行2026年が明けました。今年は「生成AIを使ったデータ分析」が、大きなテーマになりそうです。 年初のコラムですし、まずは少し広い視野で、デー …