コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2022年8月24日号より
アートを生成するAI「Midjourney」がこのところ各所で話題です。描画したいイメージのキーワードをインプットすると詳細で美しい画像を生成してくれるAIで、その認識精度の高さとアウトプットの美しさ・スムーズさ、気軽さ(無料でのトライアルが可能)も相まって瞬く間に広く知られるようになりました。このコラムを読んでおられる方々も試された方は多いのではないかと思います。
Midjourney
Midjourneyは画像を読み込ませてその画像に含まれるものをモチーフとした画像を生成することもできますし、類似画像の生成も行えますが、このAIの突出した点は「言語の認識精度」と「画像生成能力」の両方を実現していることにあると言えます。想像を絶するほどの学習データとアノテーションの為せるものであるかと思いますが、日本語でのインプットには未だバイアスが見受けられるようです。しかし、これだけの話題を呼んでいますから日本語の学習もすぐに進むことだろうと推察しています。
生成というタスクを担うようになったAI
これまで機械学習・AIが対応するタスクは主に下記の4つであるとされていました。
予測・・・需要予測、渋滞予測など蓄積されたデータから未来を予測するもの
認識・・・画像認識や音声認識など、とりわけ非構造化データから特徴ある情報を取り出すもの
分類・・・写真の自動分類など大量のデータを類似する集団に分類するもの
パターン発見・・・膨大なデータから併売の組み合わせなどのパターンを発見するもの
ところがこの3年ほどで「データを生成するタスク」が目的となることも多くなりました。これにはとくにニューラルネットワーク系、深層学習系、敵対的生成ネットワークなどを用いた「学習済みモデル」がGoogleやAmazonなどを始めとして数多提供されるようになったこと、学習用のデータセットの公開なども多く行われるようになったことなどが影響しています。
生成するAI、と聞くとつい思い浮かべるのは画像や音声、テキストの生成です。絵画を描く、作曲する、小説を書く ―日本経済新聞社が主催する文学賞「星新一賞」では人間以外の応募も可能となり少し前に話題になりました― が、期待されるのはこれらアートの方面だけではありません。(アートもこれらをインスピレーションとして実在するものを人間がアレンジしたり、想起することに使うという時代に入ったということでしょう)
私が最も期待したいのは、データの匿名化・仮名化の領域や、学習データが少ない状況、発生が少ないケースにおいての代替データ生成、欠損値の補填などに活かす領域です。とりわけ医療の領域や異常検知などにおいてはこれらの「生成系」技術が多く活かされてくることを期待しており、私も自身の取り組む解析プロジェクトにおいてデータの生成にはチャレンジしています。
匿名化・仮名化においてはたとえばデータホルダーとなっている存在の企業や団体組織が個票データ・生データのオープン化に踏み切る際に「類似したデータを生成し、それを公開する」という方向性が期待できると考えています。21世紀の大いなる資産であるデータを「生み出す」技術には、その他にも大いなる可能性が期待できそうです。
「生成されたデータ」の知的財産権については非常に解釈が難しいとも感じています。模写して描いた絵なのか、インスピレーションを得て描いた絵なのか、贋作なのか。絵画には有名画家が模写した有名画家の絵というのもあります。趣味の絵画鑑賞の世界でよく語られる議論、データの世界でも行われる必要がありそうです。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2025/09/10(水)
オンラインセミナー「手間ゼロの広告レポーティングを「Looker Studio」×「Databeat」で実現する方法」|2025/9/10(水)
ツール研究会の2回目は、Databeatがテーマです。 広告データの収集から蓄積・レポート作成までを自動化できる「Databeat」の活用方 …
2025/08/27(水)
オンラインセミナー「GA4のセグメントで分析が変わる!探索レポート活用術」|2025/8/27(水)
このセミナーでは、Google アナリティクス 4(GA4)をより実践的に使いこなすために探索レポートのセグメント機能を基礎から活用術まで学 …
2025/07/16(水)
オンラインセミナー「【Canva入門 for マーケ担当者】広告・解析レポートをサクッと伝わるデザインにしてみよう!」|2025/7/16(水)
2025年スタートの新企画「ツール研究会」の第一弾は、「Canva」を取りあげます。 急なバナー作成やCTA差し込み、レポート用スライド作成 …
【コラム】生成AI時代、独自性・原体験をどうコンテンツに組み込んでいくのか
株式会社A-can 白砂 ゆき子生成AIが業務に浸透することで、コンテンツ制作におけるリソース配分は大きく変わりました。以前は原稿執筆の作業時間が最も長く、次に構成、そして …
【コラム】国家の統計データは、羅針盤であり内視鏡であり私たちの鏡です
アナリティクスアソシエーション 大内 範行8月1日に米国で発表された雇用統計で、過去の就業者数が大幅に下方修正されたことがニュースで話題になりました。 「いくらなんでも変わりすぎ」と …
仕事をする上で、ピントを合わせることを大切にしている。 筆者はカメラマンではないが、普段料理や愛猫の写真をよく撮る。オートフォーカス機能のお …