コラムバックナンバー

アートを生成するAI「Midjourney」がこのところ各所で話題です。描画したいイメージのキーワードをインプットすると詳細で美しい画像を生成してくれるAIで、その認識精度の高さとアウトプットの美しさ・スムーズさ、気軽さ(無料でのトライアルが可能)も相まって瞬く間に広く知られるようになりました。このコラムを読んでおられる方々も試された方は多いのではないかと思います。
Midjourney

Midjourneyは画像を読み込ませてその画像に含まれるものをモチーフとした画像を生成することもできますし、類似画像の生成も行えますが、このAIの突出した点は「言語の認識精度」と「画像生成能力」の両方を実現していることにあると言えます。想像を絶するほどの学習データとアノテーションの為せるものであるかと思いますが、日本語でのインプットには未だバイアスが見受けられるようです。しかし、これだけの話題を呼んでいますから日本語の学習もすぐに進むことだろうと推察しています。

生成というタスクを担うようになったAI

これまで機械学習・AIが対応するタスクは主に下記の4つであるとされていました。

予測・・・需要予測、渋滞予測など蓄積されたデータから未来を予測するもの
認識・・・画像認識や音声認識など、とりわけ非構造化データから特徴ある情報を取り出すもの
分類・・・写真の自動分類など大量のデータを類似する集団に分類するもの
パターン発見・・・膨大なデータから併売の組み合わせなどのパターンを発見するもの

ところがこの3年ほどで「データを生成するタスク」が目的となることも多くなりました。これにはとくにニューラルネットワーク系、深層学習系、敵対的生成ネットワークなどを用いた「学習済みモデル」がGoogleやAmazonなどを始めとして数多提供されるようになったこと、学習用のデータセットの公開なども多く行われるようになったことなどが影響しています。

生成するAI、と聞くとつい思い浮かべるのは画像や音声、テキストの生成です。絵画を描く、作曲する、小説を書く ―日本経済新聞社が主催する文学賞「星新一賞」では人間以外の応募も可能となり少し前に話題になりました― が、期待されるのはこれらアートの方面だけではありません。(アートもこれらをインスピレーションとして実在するものを人間がアレンジしたり、想起することに使うという時代に入ったということでしょう)

私が最も期待したいのは、データの匿名化・仮名化の領域や、学習データが少ない状況、発生が少ないケースにおいての代替データ生成、欠損値の補填などに活かす領域です。とりわけ医療の領域や異常検知などにおいてはこれらの「生成系」技術が多く活かされてくることを期待しており、私も自身の取り組む解析プロジェクトにおいてデータの生成にはチャレンジしています。

匿名化・仮名化においてはたとえばデータホルダーとなっている存在の企業や団体組織が個票データ・生データのオープン化に踏み切る際に「類似したデータを生成し、それを公開する」という方向性が期待できると考えています。21世紀の大いなる資産であるデータを「生み出す」技術には、その他にも大いなる可能性が期待できそうです。

「生成されたデータ」の知的財産権については非常に解釈が難しいとも感じています。模写して描いた絵なのか、インスピレーションを得て描いた絵なのか、贋作なのか。絵画には有名画家が模写した有名画家の絵というのもあります。趣味の絵画鑑賞の世界でよく語られる議論、データの世界でも行われる必要がありそうです。

コラム担当スタッフ

菅 由紀子

株式会社Rejoui
代表取締役

株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

  • 【コラム】時系列データ解析のための「コロナ禍のデータ」

    株式会社Rejoui 菅 由紀子
    発信元:メールマガジン2022年9月21日号より

    2019年12月に世界で初めて新型コロナウイルスの感染者が報告されてから2年8ヶ月が経過しました。先日、WHOのテドロス事務局長がこのパンデ …

  • 【コラム】接点を。もっと接点を

    株式会社真摯 いちしま 泰樹
    発信元:メールマガジン2022年9月14日号より

    あるBtoCのWebサイトの状況を分析していたとき、全体的にモバイルのトラフィックのコンバージョンの状況が非常に良いことに気が付きました。ど …

  • 【コラム】データの見方のおさらい~変数の4つの尺度

    Option合同会社 柳井 隆道
    発信元:メールマガジン2022年9月7日号より

    今回はデータ分析の際の基本のおさらいです。 データの中の変数には人数、年齢のような量を表す変数と、居住地域、性別のような質を表す変数がありま …

バックナンバー一覧へ