データサイエンティスト・ジャパン2024 Data Scientist Japan 2024 Review

SAS Institute Japan

偏りで生じる倫理的リスクに注意AI時代における人間中心のデータ活用

AI(人工知能)の適用分野は着実に広がり、企業のデータドリブン経営に貢献している。その一方、肝心のデータは必ずしも現実社会を正確に投影しているとはいえず、偏りのあるデータから得た洞察や行動は倫理に反する結果となるリスクがある。こうしたデータ活用における倫理的な課題に取り組むためのアナリティクス・プラットフォームを提供し、データ中心から人間中心へのシフトを提言するのがSAS Institute Japanの小林 泉氏だ。

データドリブンな社会の実現が叫ばれ、収集したデータを分析して、企業の成長に生かそうという機運が高まっている。だが、SAS Institute Japanの小林氏は「データを起点にして分析していても、倫理的なAI活用の必要性には気づいていないケースが少なくありません」と指摘する。AIの活用がデータありきになっていることの危険性が、広く認識されていないというのだ。

データサイエンティストがデータをビジネスに活用するには、大きく3つのパターンがある。「売上の増大、コストの削減、リスクの発見といった目的があります。そうした目的に向かってデータを活用するときの全体構造は、人間社会の情報をデータ化してデジタル空間に表現する『Sence』、データを使ってモデリングする『Understand』、デジタル空間で得られた洞察から人間社会に働きかける『Act』で構成しています」(小林氏)。そうしたデータ活用の目的と構造を把握した上で、小林氏は「倫理的な課題が潜んでいます」と言う。

小林 泉 氏

SAS Institute Japan

Architecture & Platformソリューション本部

本部長

小林 泉

人間社会を100%デジタル化するのは難しい

Senseの部分では「家電でIoT情報を取得したり、小売りでPOSデータを収集したりしていますが、それで人間社会の情報をデジタル社会に100%投影できているでしょうか」と小林氏は疑問を投げかける。まず取得したデータが目的を満たすものなのか、そのデータは人間社会を正しく写し取っているのか、という点が最初の課題である。

小林氏は「ほとんどのデータには偏りがあります。POSデータは商品購買の1つの側面を示すだけで、自社データは過去の意思決定や活動の結果に過ぎません」と語る。今あるそれらのデータを正しいものとして分析しても、もとになるデータそのものが現実社会を正しく投影していなかったり、偏った側面しか表現できていなかったりする場合には、分析結果は目的に沿ったものにならないリスクがあるというわけだ。

「データリテラシーを『データを読む力』と解釈することがあります。データを見つめて、多様な手法で分析したり考えたりするのですが、データだけを料理することと捉えると問題があります。データリテラシーとは、データの理解を通じて現実社会を理解しようとする心構えのことを指すと考えてほしいのです」(小林氏)。

人間中心のモデリングによる現実社会への働きかけが不可欠

次いで小林氏は、Understand部分についての倫理的な課題を述べた。「これまでのモデリング手法は、人間社会をモデル化する人間中心のモデリングでした。しかし昨今はAIによる自動化ツールが登場し、人間の能力を超えたところでモデリングされるようになってきました」。

人間中心のモデリングとデータ中心のモデリングを理解する例として、小林氏は通信サービスの顧客の場合を例に挙げた。「従来は、顧客ごとの過去の利用情報や属性などを収集し、言葉でプロファイルを説明できるようにモデリングしてきました。ところが最近は、無数の説明変数を使って与えられたデータから説得力がある結果を得られるように、ツールがモデリングします。結果として、どのような説明変数があって、現実社会のどんなプロファイルに相当するか、もはや理解できなくなっています」(小林氏)。

すなわち、モデリングする対象が人間中心のモデリングでは現実社会だったのに対して、最近のデータ中心のモデリングでは収集したデータになってしまうリスクがあるとの指摘だ。その最大のデメリットが「過去のデータをいくらモデリングしても、未来はつくれないこと」だと小林氏は看破する。

さらにActの部分でも、データありきの分析には課題があるという。「データで現実社会をSenseしモデリングして分析した結果に応じて、商品を売り込んだり、返してくれそうな人にお金を貸したりという働きかけをしています。しかし、データに偏りがあった場合には、働きかけに不公平が生じてしまいます」(小林氏)。

例として小林氏は金融機関による商品提案の意思決定フローを挙げた。信用リスクスコアリング判定ツールをフローに組み込み、リスクが低い顧客に対しては新規のサービスを提案するといった使い方だ。その際に、カードローンの返済の確率が男性のほうが高いという過去のデータを学習したモデルでは、男性ばかりにカードローンを提案するという意思決定の偏りをもたらすリスクをはらんでいる。「信用リスクスコアリング判定のモデルを作成したときに用いた学習データの偏りや、モデルの判定基準を説明できることが必要です」(小林氏)。

人間中心のデータ活用を実践するプラットフォーム

データ活用の全体構造を構成する各ステップにおいて、AIがデータ活用する際の倫理的な課題を整理して説明した上で小林氏は「AIの倫理問題が注目されています。単にデータを持ってきて、モデリングしてアプリケーションを作ればいい時代ではなくなりました。データやモデリング、現実社会への働きかけについて、責任を持って管理、説明できないといけない時代になってきています」と説明する。

また、倫理的な課題と同時に、企業がデータ分析をビジネスに生かし切れていない理由の1つにデータ中心のデータ活用の限界があると指摘する。人間中心で考えるデータ活用を実践することで、ビジネスでの成果が得られるようになっていく。

SAS Institute Japanは人間中心のデータ活用を実践するために有効なプラットフォームを用意して、企業の課題解決に貢献する。

アナリティクス・プラットフォーム
SASでは、米国の国立標準技術研究所 (NIST) によって定義されたAI リスク管理フレームワークによって設定された標準とベストプラクティスを適用したワークフローを提供するアナリティクス・プラットフォームを提供している

【画像をクリックすると拡大します】

「SASは、国立標準技術研究所(NIST)によって定義されたAIリスク管理フレームワークで設定された標準に準拠し、ベストプラクティスを適用したワークフローを提供するアナリティクス・プラットフォームを用意しています。このプラットフォームをスタートラインにすることで、データ活用に倫理的な視点を盛り込めます」(小林氏)。人間中心のデータ活用により、現実社会をより良くしながらビジネスの持続可能性を高めるための1つの手法として、こうしたプラットフォームの効能に期待したい。