コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2020年10月14日号より
新内閣の閣僚に占める女性割合が減ったというニュースから少し経ちます。政治の世界に限らずgender parity(男女比の均衡)は極めて重要な課題で、私が身を置くデータ×AIの世界においては、技術の発展と共により深刻度合いを増しています。
私自身はこの課題の深刻さに気がついてから、Women in Data Science(ジェンダーに限らずデータサイエンス領域で活動する人を奮起させ、教育し、支援するスタンフォード大学発の世界的な活動)に賛同して色々と発信していますが、まだまだこの領域の女性プレイヤーは足りていないと感じています。では実際どのくらいなのか?というと、データサイエンティスト協会による会員企業向けの2019年アンケート調査で13%という結果でした。同じ調査の2015年の調査結果では6%だったわけですから、増加傾向にはあるのですが、それでも少ない数字です。
男女差がある組織においては、性別によって差異の起こり得る事象を取り扱う際、偏りが生じないよう配慮する必要があります。反対の立場であれば気づくことのできた事象に気が付かず、そのままデータ処理を進めてしまい、あとになって重要な差異に気がつくということはあらゆるケースで起こります。男女差だけでなく、データやAIを扱う者はいわゆるデータバイアス、アルゴリズムバイアスが起きないよう配慮する必要があります。また、常に公平性や倫理観を持って臨む姿勢も求められます。その理由については、以前こちらのコラムで触れていますので、ご確認ください。
【コラム】AI・データと公平性・倫理について
前置きが長くなりましたが、今回は、この2つのバイアスについてご説明したいと思います。
・データバイアスとは
データバイアスとは、差別、偏見、誤った認識により収集してしまったデータのことをいいます。様々なケースが考えられますが、たとえば極端な例を挙げると、日本全国の高校生のお小遣い平均額を知りたいのに、東京都新宿区の高校生のみのデータを用いて日本の高校生の平均を語る、などといったケースが考えられます。
データの収集方法、収集数、処理工程などの提示は統計的アプローチには必須ですが、ここの偏りの見落としは意外と生じやすいものです。特にテレビ番組のワイドショー的な報道には多く見受けられると思います。私たちデータ分析者は、集めるデータが適切な方法で偏りなく集められているか、偏りがあるとすればどのような点に留意しなければならないかを関係者に提示する姿勢が求められます。
・アルゴリズムバイアスとは
アルゴリズムバイアスは、偏った学習データを与えてしまったことにより、機械学習(AI)のアルゴリズムが偏った結果を学習してしまうことをいいます。先に挙げたコラムで紹介しているAmazonの採用AIなどは、まさにその典型的な例といえます。ここを防ぐために私自身が気をつけていることは「反対の価値観や立場を常に意識する」「もれなく重複なく課題に対する立場を網羅できているか」という姿勢です。そして、この姿勢を保つためには世界のあらゆる価値観を理解する必要があり、結局のところデータを扱う者に求められるリテラシーは「幅広く世の中を知る」ということではないでしょうか。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
2024/02/21(水)
オンラインセミナー「生成AI時代到来 今後のSEOのポイントを考える」|2024/2/21(水)
2023年は生成AI・SGE(Google Search Generative Experience)・Bardの登場、Bingの躍進など、 …
【コラム】ユニバーサルアナリティクス より自由度が高くなったことによる GA4 の弊害
株式会社JADE 村山 佑介こんにちは、株式会社JADEの村山です。過去にはa2iのセミナーで数回、Googleアナリティクス についてのセミナー等に登壇をさせていただ …
今回のテーマは、「【コラム】ポストCookie時代、AI時代? その前に、2024年は顧客理解の再定義を」の続きです。顧客理解を深めることで …
【コラム】わからないなか、わからないなりに、わかるものをつくろうとする構想力について
アユダンテ株式会社 寳 洋平ヘルプをちゃんと読むこと このコラムを読んでいる方は、デジタルマーケティングに深く携わっている人が多いと想像する。そんなあなたなら、先輩から …