コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2020年10月14日号より
新内閣の閣僚に占める女性割合が減ったというニュースから少し経ちます。政治の世界に限らずgender parity(男女比の均衡)は極めて重要な課題で、私が身を置くデータ×AIの世界においては、技術の発展と共により深刻度合いを増しています。
私自身はこの課題の深刻さに気がついてから、Women in Data Science(ジェンダーに限らずデータサイエンス領域で活動する人を奮起させ、教育し、支援するスタンフォード大学発の世界的な活動)に賛同して色々と発信していますが、まだまだこの領域の女性プレイヤーは足りていないと感じています。では実際どのくらいなのか?というと、データサイエンティスト協会による会員企業向けの2019年アンケート調査で13%という結果でした。同じ調査の2015年の調査結果では6%だったわけですから、増加傾向にはあるのですが、それでも少ない数字です。
男女差がある組織においては、性別によって差異の起こり得る事象を取り扱う際、偏りが生じないよう配慮する必要があります。反対の立場であれば気づくことのできた事象に気が付かず、そのままデータ処理を進めてしまい、あとになって重要な差異に気がつくということはあらゆるケースで起こります。男女差だけでなく、データやAIを扱う者はいわゆるデータバイアス、アルゴリズムバイアスが起きないよう配慮する必要があります。また、常に公平性や倫理観を持って臨む姿勢も求められます。その理由については、以前こちらのコラムで触れていますので、ご確認ください。
【コラム】AI・データと公平性・倫理について
前置きが長くなりましたが、今回は、この2つのバイアスについてご説明したいと思います。
・データバイアスとは
データバイアスとは、差別、偏見、誤った認識により収集してしまったデータのことをいいます。様々なケースが考えられますが、たとえば極端な例を挙げると、日本全国の高校生のお小遣い平均額を知りたいのに、東京都新宿区の高校生のみのデータを用いて日本の高校生の平均を語る、などといったケースが考えられます。
データの収集方法、収集数、処理工程などの提示は統計的アプローチには必須ですが、ここの偏りの見落としは意外と生じやすいものです。特にテレビ番組のワイドショー的な報道には多く見受けられると思います。私たちデータ分析者は、集めるデータが適切な方法で偏りなく集められているか、偏りがあるとすればどのような点に留意しなければならないかを関係者に提示する姿勢が求められます。
・アルゴリズムバイアスとは
アルゴリズムバイアスは、偏った学習データを与えてしまったことにより、機械学習(AI)のアルゴリズムが偏った結果を学習してしまうことをいいます。先に挙げたコラムで紹介しているAmazonの採用AIなどは、まさにその典型的な例といえます。ここを防ぐために私自身が気をつけていることは「反対の価値観や立場を常に意識する」「もれなく重複なく課題に対する立場を網羅できているか」という姿勢です。そして、この姿勢を保つためには世界のあらゆる価値観を理解する必要があり、結局のところデータを扱う者に求められるリテラシーは「幅広く世の中を知る」ということではないでしょうか。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2025/11/18(火)
【大型イベント開催】a2i秋の広告祭 デジタル広告の役割を再設計しよう|2025/11/18(火)
a2i秋の広告祭 デジタル広告の役割を再設計しよう デジタル広告のこれからを半日で学ぶ!豪華11名のスペシャリストが集結! デジタル広告のテ …
2025/10/30(木)
オンラインセミナー「Microsoft Clarity×GA4横断分析で実現するサイト改善」|2025/10/30(木)
ヒートマップやセッションレコーディングを導入しているものの、「何を見ればよいのか分からない」「改善施策に繋がらない」と感じたことはありません …
2025/10/16(木)
オンラインセミナー「Cookieレス時代に取り組むべき攻めと守りの計測方法」|2025/10/16(木)
近年、AppleのITP(Intelligent Tracking Prevention)や各国のプライバシー規制強化により、従来のCook …
株式会社ナンバーの渋谷です。今回は「データ分析の民主化」が進む中で、その土台となる「データ整備」の重要性について考えてみたいと思います。 結 …
【コラム】広告の効果計測、誰を頼ればいいのか? ―混沌を乗り越える越境チーム作り
アナリティクスアソシエーション 大内 範行広告の計測まわりでふつふつと音を立てるマグマ溜まり 「最近の広告レポート、本当にこの数字に頼っていいのかが疑問なんです」 最近、こんな問いか …
【コラム】わからない・忙しい・お金がないをDMAICで解決する
運営堂 森野 誠之イントロ 小さな会社の支援をしていると、やることはわかっていても進まないことが本当に多いです。理由はほぼこの3つ。 わからない 忙しい お金 …