コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年8月24日号より
アートを生成するAI「Midjourney」がこのところ各所で話題です。描画したいイメージのキーワードをインプットすると詳細で美しい画像を生成してくれるAIで、その認識精度の高さとアウトプットの美しさ・スムーズさ、気軽さ(無料でのトライアルが可能)も相まって瞬く間に広く知られるようになりました。このコラムを読んでおられる方々も試された方は多いのではないかと思います。
Midjourney
Midjourneyは画像を読み込ませてその画像に含まれるものをモチーフとした画像を生成することもできますし、類似画像の生成も行えますが、このAIの突出した点は「言語の認識精度」と「画像生成能力」の両方を実現していることにあると言えます。想像を絶するほどの学習データとアノテーションの為せるものであるかと思いますが、日本語でのインプットには未だバイアスが見受けられるようです。しかし、これだけの話題を呼んでいますから日本語の学習もすぐに進むことだろうと推察しています。
生成というタスクを担うようになったAI
これまで機械学習・AIが対応するタスクは主に下記の4つであるとされていました。
予測・・・需要予測、渋滞予測など蓄積されたデータから未来を予測するもの
認識・・・画像認識や音声認識など、とりわけ非構造化データから特徴ある情報を取り出すもの
分類・・・写真の自動分類など大量のデータを類似する集団に分類するもの
パターン発見・・・膨大なデータから併売の組み合わせなどのパターンを発見するもの
ところがこの3年ほどで「データを生成するタスク」が目的となることも多くなりました。これにはとくにニューラルネットワーク系、深層学習系、敵対的生成ネットワークなどを用いた「学習済みモデル」がGoogleやAmazonなどを始めとして数多提供されるようになったこと、学習用のデータセットの公開なども多く行われるようになったことなどが影響しています。
生成するAI、と聞くとつい思い浮かべるのは画像や音声、テキストの生成です。絵画を描く、作曲する、小説を書く ―日本経済新聞社が主催する文学賞「星新一賞」では人間以外の応募も可能となり少し前に話題になりました― が、期待されるのはこれらアートの方面だけではありません。(アートもこれらをインスピレーションとして実在するものを人間がアレンジしたり、想起することに使うという時代に入ったということでしょう)
私が最も期待したいのは、データの匿名化・仮名化の領域や、学習データが少ない状況、発生が少ないケースにおいての代替データ生成、欠損値の補填などに活かす領域です。とりわけ医療の領域や異常検知などにおいてはこれらの「生成系」技術が多く活かされてくることを期待しており、私も自身の取り組む解析プロジェクトにおいてデータの生成にはチャレンジしています。
匿名化・仮名化においてはたとえばデータホルダーとなっている存在の企業や団体組織が個票データ・生データのオープン化に踏み切る際に「類似したデータを生成し、それを公開する」という方向性が期待できると考えています。21世紀の大いなる資産であるデータを「生み出す」技術には、その他にも大いなる可能性が期待できそうです。
「生成されたデータ」の知的財産権については非常に解釈が難しいとも感じています。模写して描いた絵なのか、インスピレーションを得て描いた絵なのか、贋作なのか。絵画には有名画家が模写した有名画家の絵というのもあります。趣味の絵画鑑賞の世界でよく語られる議論、データの世界でも行われる必要がありそうです。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
2024/02/21(水)
オンラインセミナー「生成AI時代到来 今後のSEOのポイントを考える」|2024/2/21(水)
2023年は生成AI・SGE(Google Search Generative Experience)・Bardの登場、Bingの躍進など、 …
【コラム】車座分析のススメ サイト改善のよいタスクチームが組めるか?
アナリティクスアソシエーション 大内 範行前回は「広告予算再考」と題して「どんぶり勘定のススメ」について書きました。ただ、状況が悪化しているとはいえ、それでも広告は各プラットフォーム …
【コラム】ユニバーサルアナリティクス より自由度が高くなったことによる GA4 の弊害
株式会社JADE 村山 佑介こんにちは、株式会社JADEの村山です。過去にはa2iのセミナーで数回、Googleアナリティクス についてのセミナー等に登壇をさせていただ …
今回のテーマは、「【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義を」の続きです。顧客理解を深めることで …