コラムバックナンバー
アナリティクスアソシエーション 大内 範行
発信元:メールマガジン2019年10月9日号より
9月29日に「NHKスペシャル | AIでよみがえる美空ひばり」という番組が放送されました。Twitterなどで話題になっていたので、見た方、関心を持った方も多いでしょう。すでに故人となった美空ひばりの新曲を、AIで本人が歌っているように再現する、というある意味無謀な番組でした。
私自身、見る前はかなり懐疑的でしたが、見終わったあとは素直に新曲に「感動」していました。
感動するレベルの番組であると同時に、AI最高峰のプロジェクトを追体験できる貴重な番組でもあったと思います。今回はその視点でコラムを書いてみます。
率直に言って「いやー、本気出すとAIってやっぱり人手がかかるし、最高の人材を投入しないとダメなのね」というのが「感動」の後にやってきた感想でした。
いくつか語りたい論点がありましたが、今回は二つ。
一つ目は「ダメ出し」と、二つ目は「データの前処理」です。この二つがとても印象に残りました。
まず「ダメ出し」の方から。
今回美空ひばりの歌声を再現するに当たって、後援会の人たちや、新曲をプロデュースする秋元康などが、締め切り1ヶ月前ぐらいで、AIが再現した歌声に対して、評価ダメ出しをしていきます。
これが容赦がありません。秋元康は「雑味が足りない」と言い放ちますが、それぞれが「ひばりさんならもっと高いレベルで歌うはずだ」という趣旨のことを言います。求めているのは機械のモノマネではなく、リアルな美空ひばりの「感動」なのです。
ヤマハの開発者たちに肩入れして見ていた私は、「まあ、ここまでできれば」と思ってしまいますが、それではとても許されません。見ている私も、若干胃のあたりが痛くなってきます。
しかし、これはとても正しいアプローチで、AIのプロジェクトを評価する人たちは、AIの凄さや開発の苦労など知らない、現場の人である必要があります。例えば在庫予測をする機械学習の場合、十分な事前発注期間を置いてかなり正確な予測が出ないと運用では使い物になりません。開発環境やPOC(コンセプトの検証)のレベルから、実データで運用に載せるレベルに持っていくには、最後のワンマイルが果てしなく大変です。
現場の容赦ないダメ出しを、AIの開発実装チームが経験し、成長してこそ、本当に使えるものができるのでしょう。
もう一つは「データの前処理です」これは番組では語られなかったテーマです。
番組の前半、AIの説明で、AIに取り込む教師データの話になったとき、「まず美空ひばりさんの歌だけのデータをレコード会社が提供します」とさらっと流しました。
「いやちょっと待て??そこ大変だよね」と声を上げてしまいました。いわゆるデータの前処理のところを、番組は端折ったわけです。まあわかります。データ前処理の苦労話なんて、放送しても仕方ないですからね。
その辺は、番組視聴後、ITmedia Newsの記事に詳しく書いてありました。
「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた」
この記事にはこんな記述があります。
「音源は、時間の経過で劣化しているものもあるが、もともとは収録スタジオで専門の機材を使って収録された商業レベルの音声だった。しかし、時代によって音声の収録環境が異なり、録音方法も変わっていったため、楽曲ごとに音質がばらついていたのだ。(中略)美空ひばりさん本人の歌い方にも変化がある。デビューしたばかりの声と晩年の声では、声色にも歌い方の癖にも違いがある。また、「七色の声を持つ」ともいわれた美空ひばりさんは、曲調に応じた歌い分けも行っていた。演歌を歌うのとジャズやバラードを歌うのとでは、出てくる癖が違うのだ。」
まあ、そうですよね。歌手に発声してもらって録音しなおせば良いのですが、もちろんそんなわけにはいきません。
このデータの前処理だけでなく、最適な機械学習モデル選びの試行錯誤、「雑味」を再現するための微妙な発声やリズムの補正など、「AIならよろしくやってくれる」「AIなんだから人いらなくなるよね」というイメージからは程遠い血の滲むような苦労が感じられます。
プロジェクト期間も1年半を要したそうなので、まともに人月換算したらヤマハの開発者だけでも相当な金額になっているはずです。
機械学習も、その機能自体は安価に利用できる時代になってきました。あちこちで山のようにPOCや実証実験がおこなれています。
一方でビジネスインパクトが出るレベルに持っていくには、質も量も想像以上に人材の投入が必要だというのが現実なのでしょう。
これからAIに取り組む人たちは、十分なデータと高いレベルのダメ出しを経験できる、ヒリヒリする現場が不可欠です。中途半端なPOCを繰り返しているだけでは、ものになりません。
AIが歌う美空ひばりの新曲に感動しながら、「いやー、大変だぞこれ」と胃のあたりを押さえている自分がいました。
アナリティクスアソシエーション代表
日本アイ・ビー・エム、マイクロソフト、Google。Googleでは2011年から7年間、Googleアナリティクスのマネージャなどを歴任。その他、SEO会社起業や日本の事業会社のデジタルマーケティングに従事してきた。
2019年からはJellyfishにVP Analyticsとして参画。
並行して2008年から協議会「アナリティクスアソシエーション (a2i.jp)」代表としてウエブ分析の普及に取り組んでいる。
仕事の傍SEOやアナリティクスの書籍も多数執筆。
主な著書『できる100ワザ SEO&SEM』、『できる100ワザ Google Analytics』、『SEM Web担当者が身につけておくべき新100の法則』など。
2021/03/11(木)
オンラインセミナー「地方かつ1人で頑張るweb担当者さんの成功事例」|2021/3/11(木)
■□ お知らせ □■ 一般参加が可能になりました 当セミナーは、当初有料会員限定を予定していましたが、一般の方が参加可能な無料セミナーとなり …
2021/02/18(木)
オンラインセミナー「はじめてのGoogleデータポータル&Google BigQuery」|2021/2/18(木)
2016年に米国でベータ版が公開されたGoogleデータポータル。 製品のリリースノートが何回更新されているかを調べてみたところ、年々回数が …
2021/01/20(水)
オンラインセミナー「Google アナリティクス エキスパートによるQ&A祭り」|2021/1/20(水)
皆さんのGoogle アナリティクスに対する疑問を、エキスパートが解決していきます。広く普及しているGoogle アナリティクスですが、自己 …
【コラム】「誰かに嫌われない」よりも「誰かに支持される」を意識する
株式会社真摯 いちしま 泰樹「誰かに嫌われない」「みんなに嫌われない」よりも、「誰かに熱量を持って支持される」ことを意識した方が良いです。 デジタルな領域のビジネスにお …
Eテレ夜放送の「ヒャダ×体育のワンルーム☆ミュージック」という番組が好きで毎回見ています。今や、楽譜やコードなど音楽理論を知らなくても、音楽 …
【コラム】サードパーティcookieの廃止へのスケジュールと置き換え技術 (2)
Option合同会社 柳井 隆道「サードパーティcookieの廃止へのスケジュールと置き換え技術 (1)」より続きます。 Chromeのサードパーティcookieの置き換え …