コラムバックナンバー

新内閣の閣僚に占める女性割合が減ったというニュースから少し経ちます。政治の世界に限らずgender parity(男女比の均衡)は極めて重要な課題で、私が身を置くデータ×AIの世界においては、技術の発展と共により深刻度合いを増しています。

私自身はこの課題の深刻さに気がついてから、Women in Data Science(ジェンダーに限らずデータサイエンス領域で活動する人を奮起させ、教育し、支援するスタンフォード大学発の世界的な活動)に賛同して色々と発信していますが、まだまだこの領域の女性プレイヤーは足りていないと感じています。では実際どのくらいなのか?というと、データサイエンティスト協会による会員企業向けの2019年アンケート調査で13%という結果でした。同じ調査の2015年の調査結果では6%だったわけですから、増加傾向にはあるのですが、それでも少ない数字です。

男女差がある組織においては、性別によって差異の起こり得る事象を取り扱う際、偏りが生じないよう配慮する必要があります。反対の立場であれば気づくことのできた事象に気が付かず、そのままデータ処理を進めてしまい、あとになって重要な差異に気がつくということはあらゆるケースで起こります。男女差だけでなく、データやAIを扱う者はいわゆるデータバイアス、アルゴリズムバイアスが起きないよう配慮する必要があります。また、常に公平性や倫理観を持って臨む姿勢も求められます。その理由については、以前こちらのコラムで触れていますので、ご確認ください。

【コラム】AI・データと公平性・倫理について

前置きが長くなりましたが、今回は、この2つのバイアスについてご説明したいと思います。

・データバイアスとは
データバイアスとは、差別、偏見、誤った認識により収集してしまったデータのことをいいます。様々なケースが考えられますが、たとえば極端な例を挙げると、日本全国の高校生のお小遣い平均額を知りたいのに、東京都新宿区の高校生のみのデータを用いて日本の高校生の平均を語る、などといったケースが考えられます。
データの収集方法、収集数、処理工程などの提示は統計的アプローチには必須ですが、ここの偏りの見落としは意外と生じやすいものです。特にテレビ番組のワイドショー的な報道には多く見受けられると思います。私たちデータ分析者は、集めるデータが適切な方法で偏りなく集められているか、偏りがあるとすればどのような点に留意しなければならないかを関係者に提示する姿勢が求められます。

・アルゴリズムバイアスとは
アルゴリズムバイアスは、偏った学習データを与えてしまったことにより、機械学習(AI)のアルゴリズムが偏った結果を学習してしまうことをいいます。先に挙げたコラムで紹介しているAmazonの採用AIなどは、まさにその典型的な例といえます。ここを防ぐために私自身が気をつけていることは「反対の価値観や立場を常に意識する」「もれなく重複なく課題に対する立場を網羅できているか」という姿勢です。そして、この姿勢を保つためには世界のあらゆる価値観を理解する必要があり、結局のところデータを扱う者に求められるリテラシーは「幅広く世の中を知る」ということではないでしょうか。

コラム担当スタッフ

菅 由紀子

株式会社Rejoui
代表取締役

株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

バックナンバー一覧へ