コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年8月24日号より
アートを生成するAI「Midjourney」がこのところ各所で話題です。描画したいイメージのキーワードをインプットすると詳細で美しい画像を生成してくれるAIで、その認識精度の高さとアウトプットの美しさ・スムーズさ、気軽さ(無料でのトライアルが可能)も相まって瞬く間に広く知られるようになりました。このコラムを読んでおられる方々も試された方は多いのではないかと思います。
Midjourney
Midjourneyは画像を読み込ませてその画像に含まれるものをモチーフとした画像を生成することもできますし、類似画像の生成も行えますが、このAIの突出した点は「言語の認識精度」と「画像生成能力」の両方を実現していることにあると言えます。想像を絶するほどの学習データとアノテーションの為せるものであるかと思いますが、日本語でのインプットには未だバイアスが見受けられるようです。しかし、これだけの話題を呼んでいますから日本語の学習もすぐに進むことだろうと推察しています。
生成というタスクを担うようになったAI
これまで機械学習・AIが対応するタスクは主に下記の4つであるとされていました。
予測・・・需要予測、渋滞予測など蓄積されたデータから未来を予測するもの
認識・・・画像認識や音声認識など、とりわけ非構造化データから特徴ある情報を取り出すもの
分類・・・写真の自動分類など大量のデータを類似する集団に分類するもの
パターン発見・・・膨大なデータから併売の組み合わせなどのパターンを発見するもの
ところがこの3年ほどで「データを生成するタスク」が目的となることも多くなりました。これにはとくにニューラルネットワーク系、深層学習系、敵対的生成ネットワークなどを用いた「学習済みモデル」がGoogleやAmazonなどを始めとして数多提供されるようになったこと、学習用のデータセットの公開なども多く行われるようになったことなどが影響しています。
生成するAI、と聞くとつい思い浮かべるのは画像や音声、テキストの生成です。絵画を描く、作曲する、小説を書く ―日本経済新聞社が主催する文学賞「星新一賞」では人間以外の応募も可能となり少し前に話題になりました― が、期待されるのはこれらアートの方面だけではありません。(アートもこれらをインスピレーションとして実在するものを人間がアレンジしたり、想起することに使うという時代に入ったということでしょう)
私が最も期待したいのは、データの匿名化・仮名化の領域や、学習データが少ない状況、発生が少ないケースにおいての代替データ生成、欠損値の補填などに活かす領域です。とりわけ医療の領域や異常検知などにおいてはこれらの「生成系」技術が多く活かされてくることを期待しており、私も自身の取り組む解析プロジェクトにおいてデータの生成にはチャレンジしています。
匿名化・仮名化においてはたとえばデータホルダーとなっている存在の企業や団体組織が個票データ・生データのオープン化に踏み切る際に「類似したデータを生成し、それを公開する」という方向性が期待できると考えています。21世紀の大いなる資産であるデータを「生み出す」技術には、その他にも大いなる可能性が期待できそうです。
「生成されたデータ」の知的財産権については非常に解釈が難しいとも感じています。模写して描いた絵なのか、インスピレーションを得て描いた絵なのか、贋作なのか。絵画には有名画家が模写した有名画家の絵というのもあります。趣味の絵画鑑賞の世界でよく語られる議論、データの世界でも行われる必要がありそうです。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2025/04/16(水)
オンラインセミナー「【GA4&GTM完全攻略】それ計測したかった!を叶えよう」|2025/4/16(水)
GA4とGTMの正しい設定方法を基礎から実践まで徹底解説します。 GA4導入時に押さえておくべきポイントや、イベント設定・カスタムディメンシ …
2025/03/26(水)
オンラインセミナー「GA4はもう難しくない!最新機能と改善ポイントを徹底解説」|2025/3/26(水)
「GA4は使いにくい」と思っていませんか? それはもう過去の話!最新アップデートで、GA4はより直感的で便利な解析ツールへ進化し、ユーザーの …
2025/03/05(水)
オンラインセミナー「あの会社はこんなに伸びた!新規受注額2倍&年間受注額3倍の刃物メーカー、平均受注金額5倍のウェブ制作会社の事例」|2025/3/5(水)
2021年は刃物メーカーの1人担当者さん、2022年には小さな制作会社さんの事例を紹介しました。あれから2~3年たっても着実に成長されていま …
【コラム】電通の「日本の広告費」レポートに見る、デジタル認知広告の時代と効果測定の新しいカタチ
アナリティクスアソシエーション 大内 範行電通が今年2月末に恒例の「2024年 日本の広告費」を発表しました。皆さんにとっては、予想した驚きのないレポートかもしれません。 ただ、私は …
今回はタイトルの通りですが、GTM(Googleタグマネージャー)のあるあるを言っていきたいと思います。 前提として「どんな人が言っているの …
【コラム】プライバシー保護と法律 この山は面倒ですが登り始めましょう
アナリティクスアソシエーション 大内 範行ここ数年で個人情報保護などプライバシー保護の法律面の理解を深めて、いくつかのプロジェクトに関わるようになりました。 今では法律理解は、マーケ …