コラムバックナンバー
アナリティクスアソシエーション 大内 範行
発信元:メールマガジン2019年10月9日号より
9月29日に「NHKスペシャル | AIでよみがえる美空ひばり」という番組が放送されました。Twitterなどで話題になっていたので、見た方、関心を持った方も多いでしょう。すでに故人となった美空ひばりの新曲を、AIで本人が歌っているように再現する、というある意味無謀な番組でした。
私自身、見る前はかなり懐疑的でしたが、見終わったあとは素直に新曲に「感動」していました。
感動するレベルの番組であると同時に、AI最高峰のプロジェクトを追体験できる貴重な番組でもあったと思います。今回はその視点でコラムを書いてみます。
率直に言って「いやー、本気出すとAIってやっぱり人手がかかるし、最高の人材を投入しないとダメなのね」というのが「感動」の後にやってきた感想でした。
いくつか語りたい論点がありましたが、今回は二つ。
一つ目は「ダメ出し」と、二つ目は「データの前処理」です。この二つがとても印象に残りました。
まず「ダメ出し」の方から。
今回美空ひばりの歌声を再現するに当たって、後援会の人たちや、新曲をプロデュースする秋元康などが、締め切り1ヶ月前ぐらいで、AIが再現した歌声に対して、評価ダメ出しをしていきます。
これが容赦がありません。秋元康は「雑味が足りない」と言い放ちますが、それぞれが「ひばりさんならもっと高いレベルで歌うはずだ」という趣旨のことを言います。求めているのは機械のモノマネではなく、リアルな美空ひばりの「感動」なのです。
ヤマハの開発者たちに肩入れして見ていた私は、「まあ、ここまでできれば」と思ってしまいますが、それではとても許されません。見ている私も、若干胃のあたりが痛くなってきます。
しかし、これはとても正しいアプローチで、AIのプロジェクトを評価する人たちは、AIの凄さや開発の苦労など知らない、現場の人である必要があります。例えば在庫予測をする機械学習の場合、十分な事前発注期間を置いてかなり正確な予測が出ないと運用では使い物になりません。開発環境やPOC(コンセプトの検証)のレベルから、実データで運用に載せるレベルに持っていくには、最後のワンマイルが果てしなく大変です。
現場の容赦ないダメ出しを、AIの開発実装チームが経験し、成長してこそ、本当に使えるものができるのでしょう。
もう一つは「データの前処理です」これは番組では語られなかったテーマです。
番組の前半、AIの説明で、AIに取り込む教師データの話になったとき、「まず美空ひばりさんの歌だけのデータをレコード会社が提供します」とさらっと流しました。
「いやちょっと待て??そこ大変だよね」と声を上げてしまいました。いわゆるデータの前処理のところを、番組は端折ったわけです。まあわかります。データ前処理の苦労話なんて、放送しても仕方ないですからね。
その辺は、番組視聴後、ITmedia Newsの記事に詳しく書いてありました。
「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた」
この記事にはこんな記述があります。
「音源は、時間の経過で劣化しているものもあるが、もともとは収録スタジオで専門の機材を使って収録された商業レベルの音声だった。しかし、時代によって音声の収録環境が異なり、録音方法も変わっていったため、楽曲ごとに音質がばらついていたのだ。(中略)美空ひばりさん本人の歌い方にも変化がある。デビューしたばかりの声と晩年の声では、声色にも歌い方の癖にも違いがある。また、「七色の声を持つ」ともいわれた美空ひばりさんは、曲調に応じた歌い分けも行っていた。演歌を歌うのとジャズやバラードを歌うのとでは、出てくる癖が違うのだ。」
まあ、そうですよね。歌手に発声してもらって録音しなおせば良いのですが、もちろんそんなわけにはいきません。
このデータの前処理だけでなく、最適な機械学習モデル選びの試行錯誤、「雑味」を再現するための微妙な発声やリズムの補正など、「AIならよろしくやってくれる」「AIなんだから人いらなくなるよね」というイメージからは程遠い血の滲むような苦労が感じられます。
プロジェクト期間も1年半を要したそうなので、まともに人月換算したらヤマハの開発者だけでも相当な金額になっているはずです。
機械学習も、その機能自体は安価に利用できる時代になってきました。あちこちで山のようにPOCや実証実験がおこなれています。
一方でビジネスインパクトが出るレベルに持っていくには、質も量も想像以上に人材の投入が必要だというのが現実なのでしょう。
これからAIに取り組む人たちは、十分なデータと高いレベルのダメ出しを経験できる、ヒリヒリする現場が不可欠です。中途半端なPOCを繰り返しているだけでは、ものになりません。
AIが歌う美空ひばりの新曲に感動しながら、「いやー、大変だぞこれ」と胃のあたりを押さえている自分がいました。
アナリティクスアソシエーション代表
日本アイ・ビー・エム、マイクロソフト、Google。Googleでは2011年から7年間、Googleアナリティクスのマネージャなどを歴任。その他、SEO会社起業や日本の事業会社のデジタルマーケティングに従事してきた。
2019年からはJellyfishにVP Analyticsとして参画。
並行して2008年から協議会「アナリティクスアソシエーション (a2i.jp)」代表としてウエブ分析の普及に取り組んでいる。
仕事の傍SEOやアナリティクスの書籍も多数執筆。
主な著書『できる100ワザ SEO&SEM』、『できる100ワザ Google Analytics』、『SEM Web担当者が身につけておくべき新100の法則』など。
また、仕事の傍ら、幕末 徳川慶喜についての小説も執筆出版している。
『ケイキ君と一緒!: 幕末 最後の将軍 徳川慶喜「もしも」の物語』
幕末沼 徳川慶喜よくある質問
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
2024/02/21(水)
オンラインセミナー「生成AI時代到来 今後のSEOのポイントを考える」|2024/2/21(水)
2023年は生成AI・SGE(Google Search Generative Experience)・Bardの登場、Bingの躍進など、 …
今回のテーマは、「【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義を」の続きです。顧客理解を深めることで …
【コラム】わからないなか、わからないなりに、わかるものをつくろうとする構想力について
アユダンテ株式会社 寳 洋平ヘルプをちゃんと読むこと このコラムを読んでいる方は、デジタルマーケティングに深く携わっている人が多いと想像する。そんなあなたなら、先輩から …
【コラム】GA4を超えて:個票分析のための理想のツールについて考える
アナリティクスアソシエーション 大内 範行前回書いた年初のコラム「顧客行動の再定義」の続きです。 【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義 …