コラムバックナンバー
アナリティクスアソシエーション 大内 範行
発信元:メールマガジン2019年10月9日号より
9月29日に「NHKスペシャル | AIでよみがえる美空ひばり」という番組が放送されました。Twitterなどで話題になっていたので、見た方、関心を持った方も多いでしょう。すでに故人となった美空ひばりの新曲を、AIで本人が歌っているように再現する、というある意味無謀な番組でした。
私自身、見る前はかなり懐疑的でしたが、見終わったあとは素直に新曲に「感動」していました。
感動するレベルの番組であると同時に、AI最高峰のプロジェクトを追体験できる貴重な番組でもあったと思います。今回はその視点でコラムを書いてみます。
率直に言って「いやー、本気出すとAIってやっぱり人手がかかるし、最高の人材を投入しないとダメなのね」というのが「感動」の後にやってきた感想でした。
いくつか語りたい論点がありましたが、今回は二つ。
一つ目は「ダメ出し」と、二つ目は「データの前処理」です。この二つがとても印象に残りました。
まず「ダメ出し」の方から。
今回美空ひばりの歌声を再現するに当たって、後援会の人たちや、新曲をプロデュースする秋元康などが、締め切り1ヶ月前ぐらいで、AIが再現した歌声に対して、評価ダメ出しをしていきます。
これが容赦がありません。秋元康は「雑味が足りない」と言い放ちますが、それぞれが「ひばりさんならもっと高いレベルで歌うはずだ」という趣旨のことを言います。求めているのは機械のモノマネではなく、リアルな美空ひばりの「感動」なのです。
ヤマハの開発者たちに肩入れして見ていた私は、「まあ、ここまでできれば」と思ってしまいますが、それではとても許されません。見ている私も、若干胃のあたりが痛くなってきます。
しかし、これはとても正しいアプローチで、AIのプロジェクトを評価する人たちは、AIの凄さや開発の苦労など知らない、現場の人である必要があります。例えば在庫予測をする機械学習の場合、十分な事前発注期間を置いてかなり正確な予測が出ないと運用では使い物になりません。開発環境やPOC(コンセプトの検証)のレベルから、実データで運用に載せるレベルに持っていくには、最後のワンマイルが果てしなく大変です。
現場の容赦ないダメ出しを、AIの開発実装チームが経験し、成長してこそ、本当に使えるものができるのでしょう。
もう一つは「データの前処理です」これは番組では語られなかったテーマです。
番組の前半、AIの説明で、AIに取り込む教師データの話になったとき、「まず美空ひばりさんの歌だけのデータをレコード会社が提供します」とさらっと流しました。
「いやちょっと待て??そこ大変だよね」と声を上げてしまいました。いわゆるデータの前処理のところを、番組は端折ったわけです。まあわかります。データ前処理の苦労話なんて、放送しても仕方ないですからね。
その辺は、番組視聴後、ITmedia Newsの記事に詳しく書いてありました。
「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた」
この記事にはこんな記述があります。
「音源は、時間の経過で劣化しているものもあるが、もともとは収録スタジオで専門の機材を使って収録された商業レベルの音声だった。しかし、時代によって音声の収録環境が異なり、録音方法も変わっていったため、楽曲ごとに音質がばらついていたのだ。(中略)美空ひばりさん本人の歌い方にも変化がある。デビューしたばかりの声と晩年の声では、声色にも歌い方の癖にも違いがある。また、「七色の声を持つ」ともいわれた美空ひばりさんは、曲調に応じた歌い分けも行っていた。演歌を歌うのとジャズやバラードを歌うのとでは、出てくる癖が違うのだ。」
まあ、そうですよね。歌手に発声してもらって録音しなおせば良いのですが、もちろんそんなわけにはいきません。
このデータの前処理だけでなく、最適な機械学習モデル選びの試行錯誤、「雑味」を再現するための微妙な発声やリズムの補正など、「AIならよろしくやってくれる」「AIなんだから人いらなくなるよね」というイメージからは程遠い血の滲むような苦労が感じられます。
プロジェクト期間も1年半を要したそうなので、まともに人月換算したらヤマハの開発者だけでも相当な金額になっているはずです。
機械学習も、その機能自体は安価に利用できる時代になってきました。あちこちで山のようにPOCや実証実験がおこなれています。
一方でビジネスインパクトが出るレベルに持っていくには、質も量も想像以上に人材の投入が必要だというのが現実なのでしょう。
これからAIに取り組む人たちは、十分なデータと高いレベルのダメ出しを経験できる、ヒリヒリする現場が不可欠です。中途半端なPOCを繰り返しているだけでは、ものになりません。
AIが歌う美空ひばりの新曲に感動しながら、「いやー、大変だぞこれ」と胃のあたりを押さえている自分がいました。
アナリティクスアソシエーション代表
個人情報保護士、専門統計調査士
日本アイ・ビー・エム、マイクロソフト、Googleなどを経験。Googleでは2011年から7年間、Googleアナリティクスとダブルクリック広告のマネージャなどを歴任。
2019年からはJellyfish 副社長 VP Analyticsとして参画し、2021年からはアユダンテ株式会社でCSOに就任。
並行して2008年から協議会「アナリティクスアソシエーション (a2i.jp)」代表としてデジタルマーケティングのデータ分析の普及に取り組んでいる。
仕事の傍SEOやアナリティクスの書籍も多数執筆。
主な著書『できる100ワザ SEO&SEM』、『できる100ワザ Google Analytics』、『SEM Web担当者が身につけておくべき新100の法則』など。
2024/12/10(火)
オンラインセミナー「【GA4導入・活用術】事業会社と自社サービス担当者が語る!」|2024/12/10(火)
GA4を導入したいけれど、チーム内の理解を得られずに進められない、または導入はしたものの活用しきれていない――そんなお悩みはありませんか? …
2024/11/13(水)
オンラインセミナー「参加無料!超初心者向け!GA4にログインはできた。その次に何をすればいいかわからない人のためのセミナー。サイト改善の知恵袋付きです。」|2024/11/13(水)
GA4にログインしても何が何だかさっぱりわからないことは多いですよね。でも、Webサイトのことは知りたいし、できれば改善点も知りたい…。そん …
2024/10/30(水)
オンラインセミナー「コンテンツのKPIと評価~GA4を使った効果分析~」|2024/10/30(水)
オウンドメディアを運営し、コンテンツマーケティングに取り組む企業が増えていますが、「どのように評価すればよいかわからない」「コンバージョンが …
【コラム】新しい生成AI検索サービス 効率的な答えが見つかることは本当に幸せか?
アナリティクスアソシエーション 大内 範行ChatGPT searchが、一部のユーザーにリリースされています。 私はTeamsプランで契約があるためChromeのデフォルトサーチに …
みなさんこんにちは。渋谷にある大学、日本経済大学で教員をしております、金谷武明と申します。以前はGoogleという会社でYouTubeで検索 …
衆議院選挙が終わりました。選挙のたびに開票の時刻と同時に当選確実が出る「出口調査」の予測が話題になります。 今回、開票と同時に出した主要メデ …