コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年8月24日号より
アートを生成するAI「Midjourney」がこのところ各所で話題です。描画したいイメージのキーワードをインプットすると詳細で美しい画像を生成してくれるAIで、その認識精度の高さとアウトプットの美しさ・スムーズさ、気軽さ(無料でのトライアルが可能)も相まって瞬く間に広く知られるようになりました。このコラムを読んでおられる方々も試された方は多いのではないかと思います。
Midjourney
Midjourneyは画像を読み込ませてその画像に含まれるものをモチーフとした画像を生成することもできますし、類似画像の生成も行えますが、このAIの突出した点は「言語の認識精度」と「画像生成能力」の両方を実現していることにあると言えます。想像を絶するほどの学習データとアノテーションの為せるものであるかと思いますが、日本語でのインプットには未だバイアスが見受けられるようです。しかし、これだけの話題を呼んでいますから日本語の学習もすぐに進むことだろうと推察しています。
生成というタスクを担うようになったAI
これまで機械学習・AIが対応するタスクは主に下記の4つであるとされていました。
予測・・・需要予測、渋滞予測など蓄積されたデータから未来を予測するもの
認識・・・画像認識や音声認識など、とりわけ非構造化データから特徴ある情報を取り出すもの
分類・・・写真の自動分類など大量のデータを類似する集団に分類するもの
パターン発見・・・膨大なデータから併売の組み合わせなどのパターンを発見するもの
ところがこの3年ほどで「データを生成するタスク」が目的となることも多くなりました。これにはとくにニューラルネットワーク系、深層学習系、敵対的生成ネットワークなどを用いた「学習済みモデル」がGoogleやAmazonなどを始めとして数多提供されるようになったこと、学習用のデータセットの公開なども多く行われるようになったことなどが影響しています。
生成するAI、と聞くとつい思い浮かべるのは画像や音声、テキストの生成です。絵画を描く、作曲する、小説を書く ―日本経済新聞社が主催する文学賞「星新一賞」では人間以外の応募も可能となり少し前に話題になりました― が、期待されるのはこれらアートの方面だけではありません。(アートもこれらをインスピレーションとして実在するものを人間がアレンジしたり、想起することに使うという時代に入ったということでしょう)
私が最も期待したいのは、データの匿名化・仮名化の領域や、学習データが少ない状況、発生が少ないケースにおいての代替データ生成、欠損値の補填などに活かす領域です。とりわけ医療の領域や異常検知などにおいてはこれらの「生成系」技術が多く活かされてくることを期待しており、私も自身の取り組む解析プロジェクトにおいてデータの生成にはチャレンジしています。
匿名化・仮名化においてはたとえばデータホルダーとなっている存在の企業や団体組織が個票データ・生データのオープン化に踏み切る際に「類似したデータを生成し、それを公開する」という方向性が期待できると考えています。21世紀の大いなる資産であるデータを「生み出す」技術には、その他にも大いなる可能性が期待できそうです。
「生成されたデータ」の知的財産権については非常に解釈が難しいとも感じています。模写して描いた絵なのか、インスピレーションを得て描いた絵なのか、贋作なのか。絵画には有名画家が模写した有名画家の絵というのもあります。趣味の絵画鑑賞の世界でよく語られる議論、データの世界でも行われる必要がありそうです。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2025/11/18(火)
【大型イベント開催】a2i秋の広告祭 デジタル広告の役割を再設計しよう|2025/11/18(火)
a2i秋の広告祭 デジタル広告の役割を再設計しよう デジタル広告のこれからを半日で学ぶ!豪華11名のスペシャリストが集結! デジタル広告のテ …
2025/10/30(木)
オンラインセミナー「Microsoft Clarity×GA4横断分析で実現するサイト改善」|2025/10/30(木)
ヒートマップやセッションレコーディングを導入しているものの、「何を見ればよいのか分からない」「改善施策に繋がらない」と感じたことはありません …
2025/10/16(木)
オンラインセミナー「Cookieレス時代に取り組むべき攻めと守りの計測方法」|2025/10/16(木)
近年、AppleのITP(Intelligent Tracking Prevention)や各国のプライバシー規制強化により、従来のCook …
株式会社ナンバーの渋谷です。今回は「データ分析の民主化」が進む中で、その土台となる「データ整備」の重要性について考えてみたいと思います。 結 …
【コラム】広告の効果計測、誰を頼ればいいのか? ―混沌を乗り越える越境チーム作り
アナリティクスアソシエーション 大内 範行広告の計測まわりでふつふつと音を立てるマグマ溜まり 「最近の広告レポート、本当にこの数字に頼っていいのかが疑問なんです」 最近、こんな問いか …
【コラム】わからない・忙しい・お金がないをDMAICで解決する
運営堂 森野 誠之イントロ 小さな会社の支援をしていると、やることはわかっていても進まないことが本当に多いです。理由はほぼこの3つ。 わからない 忙しい お金 …