ビジネスや社会生活にAIが急速に普及するのに伴い、AIに関する倫理やガバナンスが注目を集めている。本連載では、Deloitte AI Instituteのグローバルリーダーが著した『信頼できるAIへのアプローチ』(ビーナ・アマナス著、森正弥・神津友武監訳/共立出版)より、内容の一部を抜粋・再編集。AIに潜む落とし穴、積極的に利用するために必要なリスク管理、そしてAIをいかに信頼できるものとして活用していくかを探る。

JBpressですべての写真や図表を見る

 第3回目は、AIに学習させるためのデータを収集する時、また収集されたデータを扱う際に注意すべきバイアスの1つ「選択バイアス」について解説する。

<連載ラインアップ>
第1回 Deloitte AI Instituteのグローバルリーダーが考える「信頼できるAI」とは?
第2回 AIに履歴書を読み込ませれば、優秀な人材を本当に素早く選び出せるか?
■第3回 バイアスのあるデータで学習したAIが、ビジネスに与える深刻な影響とは?(本稿)
第4回 CEOは男性、秘書は女性?なぜ人間が作るデータにバイアスがかかるのか?
第5回 AIを使うべきか使わぬべきか、リーダーとデータサイエンティストの責任とは?

※公開予定日は変更になる可能性がございます。この機会にフォロー機能をご利用ください。

<著者フォロー機能のご案内>
無料会員に登録すれば、本記事の下部にある著者プロフィール欄から著者フォローできます。
●フォローした著者の記事は、マイページから簡単に確認できるようになります。
会員登録(無料)はこちらから

■AIにおけるバイアスの本質

 バイアスとは人間が持つ特性であり、人間を人間たらしめている部分でもあります。人間の行動に影響を与える認知バイアスは、既に何十種類も確認されています。

 例えば、「購入後の合理化バイアス(post-purchase rationalization  bias)」は、購入したものの価格に関わらず、まるで高価であるかのように自分を説得する行為のことをいい、「イケア効果(IKEA effect)」とは、最終的なモノの品質に関わらず、自分で組み立てたモノに大きな価値を見出す行為のことをいいます。

 ほかにも、「ギャンブラーの誤(Gamblerʼs fallacy)」といって、確率は変わらないにもかかわらず、過去の出来事(負け)によって将来の出来事(勝ち)の確率を判断してしまう認知バイアスもあります。

 AIはこうした非論理的バイアスのほとんどから解放されていますが、その出力結果が不公平で信頼できないものになりうる原因として、データに潜むバイアスがあります。逆に言うと、AIが持つバイアスの主要因はデータにあるのです。

 バイアスとは、狭義的には訓練データから予測される出力値と実際の出力値の差分のことを指します。しかしここでは、バイアスとは、性別・人種・社会的地位などの、社会の根源に存在しかつ間違ったデータ収集方法によってデータに表出されるような偏見のことを指します。

 データサイエンスにおいては、データセットが現実世界を正確に反映していないことでバイアスが現れる場合もありますが、これは必ずしも人為的に発生するものではありません。

 例えば、機械のセンサが誤作動すると、不完全で不正確なデータが出力されることがありますし、また、データセットの入ったファイルが技術的な障害により破損してしまう可能性もあります。

 多くの場合には人間の行動はデータの品質や精度に影響を与えますが、これは必ずしもデータサイエンティストによる悪意や怠慢が原因ではありません。

 データが持つバイアスは、社会通念や法制度など様々な要因により生じることがあり、私たちが「これは公平性に反している」と思う事象が現実には往々にして発生しています(例えば、昇進時のジェンダーバイアスにより、女性よりも男性のほうが管理職に就くことが多いなど)。

 バイアスの要因を探求することは、一見すると学術的な問題に見えるかもしれません。しかし、バイアスがかかったデータによって訓練されたAIの判断は、ビジネスの世界において大きな影響を与える可能性もあるのです。

 ある有名な事例を紹介しましょう。ProPublicadの調査によって、全米で使用されていた犯罪者の再犯リスクをスコアリングするアルゴリズムが、人種バイアスがかかった結果を出力していたことが判明しました5

 白人の被告人は黒人の被告人と比較してリスクスコアが誤って低く出力されており、黒人の被告人は白人の被告人の約2倍、将来再犯する可能性が高いとスコアリングされていたのです。

 リスクスコアはあくまで刑期を決定するための一要素に過ぎませんでしたが、このようなバイアスによりもたらされる影響は非常に大きく、1つの間違った出力によってその人の人生を何年にもわたって変えてしまいかねないのです。

 このことを踏まえ、バイアスを軽減、場合によっては排除するために、AI開発チームはデータおよび彼ら自身を深く見つめなおさなければなりません。ではどのようなバイアスがあるのか、ここではビジネス的観点から4つの主要なバイアスに焦点を当てて考えてみましょう。

d訳注:アメリカ合衆国の非営利・独立系の報道機関。

5. Julia Angwin et al., “MachineBias,” Pro Publica, May 23, 2016

選択バイアス(Selection Bias)
 
データの収集というものは決して完璧ではありません。収集データには常に欠損や過不足が発生している可能性があります。歩道ですれ違う人々を対象にした簡単な調査を想像してみましょう。

 その際に、データの収集方法によって、データセットにどのようなバイアスが発生してしまうのか考えてみてください。歩道にいる人々は本当に代表的なサンプルなのでしょうか。調査の参加に同意しやすい人もいれば、あまり同意しない人もいるかもしれません。

 また、調査員がある属性の人を避け、特定のグループに声をかけている可能性はないでしょうか。データ収集活動に内在するバイアスは、結果としてデータセットにもバイアスがかかり、もしそのバイアスを軽減させる手段がなければ、それを基に学習させたAIモデルにもバイアスが存在することになるのです。

 AI開発においてバイアスの軽減や排除を難しくする要因は、使用されるデータが二次的なもの、つまりAIのモデリングとは無関係の行動から得られた情報であることが多い、ということです。

 二次データの例としては、販売データ、アフターマーケット製品の使用データ、広告キャンペーンのコンバージョンレートeなどが挙げられます。このような二次データであった場合、データサイエンティストはデータがどのように収集されたのか、またそのデータが対象を正確に表しているのかといった情報をほとんど確認することができません。

 またデータには受動的選択バイアス(passive selection bias)と呼ばれるバイアスが潜んでいる可能性があり、情報が十分に反映されていないことがあります。

 例えば、街角の調査員は、質問をする場所が適切でないためにモデル開発に必要なグループからの情報を集めることができなかったとします。そこで、調査員が別の地域や都市に行った場合、データセットの内容は大きく変わってしまうのでしょうか。

 一方、積極的選択バイアス(active selection bias)というバイアスもあります。それは、データセットが持つ情報をわざとオーバーサンプリングし、別の情報をアンダーサンプリングまたは排除したデータのことを指します。

 例えば、女性よりも男性の方がよく使う製品に関するフィードバックを集める際に、女性よりも男性からのフィードバックを多く収集するといった場合です。

 他にも、ある集団がデータを提供しないがために、その集団についての情報がデータに含まれなくなるという自己選択バイアスself-selection  bias)というバイアスもあります。

 このようなバイアスがあると、正しいサンプルを持たないデータセットを作成してしまう可能性があり、またそのデータを使用するデータサイエンティストにとっては、(特に二次データの場合)、このバイアスがどこにあるのかを発見することが困難になる可能性があります。

e訳注:企業と何らかの接触を持った見込み顧客のうち、実際に顧客やサービス会員に転換した人の割合。

<連載ラインアップ>
第1回 Deloitte AI Instituteのグローバルリーダーが考える「信頼できるAI」とは?
第2回 AIに履歴書を読み込ませれば、優秀な人材を本当に素早く選び出せるか?
■第3回 バイアスのあるデータで学習したAIが、ビジネスに与える深刻な影響とは?(本稿)
第4回 CEOは男性、秘書は女性?なぜ人間が作るデータにバイアスがかかるのか?
第5回 AIを使うべきか使わぬべきか、リーダーとデータサイエンティストの責任とは?

※公開予定日は変更になる可能性がございます。この機会にフォロー機能をご利用ください。

<著者フォロー機能のご案内>
無料会員に登録すれば、本記事の下部にある著者プロフィール欄から著者フォローできます。
●フォローした著者の記事は、マイページから簡単に確認できるようになります。
会員登録(無料)はこちらから

[もっと知りたい!続けてお読みください →]  ダイキンDXの知られざる苦悩、空調における「本当の変革」をどう実現するか

[関連記事]

中内功が築き上げた日本有数の巨大企業グループ、ダイエーはなぜ転落したのか

マツダの象徴、ロータリーエンジン復活に挑んだ女性主査の「生産現場改革」

Sansoen Saengsakaorat/Shutterstock.com