生成AI(人工知能)の台頭で、企業におけるデータ活用のあり方が変革期を迎えている。企業の業務データ整備とデータマネジメントの重要度が増す一方で、専門部署に限られていたデータ分析が生成AIの支援で専門外の従業員でも活用できる「データの民主化」が進む。データサイエンティストは、これまでのように分析結果や予測を意思決定者に届けるのみならず、データにアクセスしやすい環境を社内に提供する責任も求められている――。2025年3月28日(金)に開催された「データサイエンティスト・ジャパン2025」は、こうした生成AIと「データの民主化」で進化するデータ活用の“今”を、大きく俯瞰できるオンラインセミナーとなった。

データサイエンス教育に新風を吹きこむZEN大学

瀬下 大輔氏

ZEN大学

数理・データサイエンス系
コンテンツリーダー 講師

瀬下 大輔

2025年4月、ZEN大学という新しい概念の通信制の大学が開学した。運営母体は日本財団ドワンゴ学園で、学部は知能情報社会学部の1学部のみ。しかしながら、生成AIをはじめとしたデータサイエンス系のカリキュラムが多数ラインアップされており、計279科目の幅広い科目の中から選択して学ぶことができる。

入学に必要な学力試験は無く、卒業資格に必要な単位取得はオンラインで完結する。4年間の課程を修了すれば学士の資格が取得できる。授業料は年間38万円と国立大学よりも安価だ。入学定員は3500人と放送大学に次ぐ規模の通信制大学で、出願者数は定員を突破した。また、一般的な通信制大学の学生は社会人が多いが、ZEN大学は6対4の割合で高校生や浪人生が多い。このことも大きな特徴である。

カリキュラムには、社会人の社員教育やDX(デジタルトランスフォーメーション)人材の育成メニューでも採用されている、実践的なデータサイエンス系の科目が並んでいる。ZEN大学の瀬下大輔氏は、カリキュラム策定時に重視したポイントを2つ挙げた。

「AI・データサイエンスの知識を使いこなすためのスキルを習得する『つかう』ためのカリキュラムと、従来的なデータサイエンス教育で機械学習モデルや人工知能を作るための数理的な基礎を学ぶ『つくる』ためのカリキュラムがあります。前者は全学で学修が推奨されており、後者は数理科学やデータサイエンスに興味がある学生に向けて開かれています」(瀬下氏)。「つかう」「つくる」の2つの柱で、現役生から社会人まで幅広い生徒が満足できるカリキュラム構築につなげている。

例えば、データサイエンス系科目の目玉の1つである「ディープラーニング1,2,3」は、東京大学「松尾・岩澤研究室」の提供しているDeep Learning講義をZEN大学向けにアレンジした講義となる。深層学習の体系的な理論を一から学ぶことができる。

通信制大学は監視の目が届きにくく、受講や試験で不正が発生しやすいのが難点とされてきた。ZEN大学では、学びのレベルを保証するため、テクノロジーを駆使して不正防止を図る。また、4年卒業率を高めるための取り組みとして、学生が授業の理解度を自己管理できるシステムの導入や、データから異常行動を発見し、クラスコーチからの声かけにも取り組む。このように、大学運営の随所にデータを活用しているのもZEN大学ならではのユニークなポイントである。瀬下氏は、新しいデータサイエンス教育とデータ活用の取り組みを随所でアピールした。

データの保護と並んで重要となるメタデータの整備

小川 康二氏

株式会社データ総研

常務取締役

コンサルティンググループ

グループ統括マネージャ

エグゼクティブシニアコンサルタント

小川 康二

データが企業の貴重な資産であることは、既に周知の事実である。社内外のデータの収集・統合によって、企業は多様な情報を高解像度で可視化できるようになる。加えて、過去の経験などを踏まえた予測情報をタイムリーに活用すれば、企業の利潤追求に向けた決断の後押しも可能となる。そのため多くの企業では、データ活用の実践に向けた基盤の構築を目指してきた。

ただ、残念ながらデータ活用にばかり目を向けるあまり、データが抱える潜在的なリスクに対する防御、すなわちデータ保護がおざなりになっていると、データ総研の小川康二氏は指摘する。

国際的な潮流として、各国ではデータ活用の拡大に伴って法規制を強化している。特に、個人情報に関するデータに関しては、EUのGDPR(General Data Protection Regulation:一般データ保護規則)、米国のCCPA(California Consumer Privacy Act:カリフォルニア州消費者プライバシー法)、中国の個人情報保護法といった形で規制が進んでおり、違反した場合には数百億円に至る制裁金や経営者の禁固刑、事業免許取消といった厳しい制裁が待っている。

日本企業においても、まずは個人情報保護という観点での整備を進め、その先で守備範囲をデータ全般の保護として広げていくことが重要となる。具体的には、プロダクトの設計段階で管理・保護方法も同時に想定する「データプロテクション・バイ・デザイン」に基づいた開発や、データ保護影響評価による取り扱うデータの見える化、リスク分析・対応などの活動である。

一方、データ活用とデータ保護の両者をバランスよく、組織的・計画的に管理していく上で求められるのがデータ資産管理だ。ここでは、データがどのような状況で誰にアクセス権限があるのか、そしてどのように運用・管理していくのかといった活動が主となる。特に重視すべきはメタデータ(データ自体に付随する情報)で、小川氏は参加者に行動を促すべく次のように語った。

「メタデータは、データ同様に、企業にとってのナレッジそのものともいえる唯一無二の貴重な資産です。そのため、独立性と柔軟性を担保して一元管理することが重要です。メタデータを整備すれば、AIを活用する際にもデータの意味を正確に判断できるようになり、AIの分析精度が向上します。ただし、メタデータの整備は非常に時間がかかります。効果を早期に刈り取るためにも1日も早く始めていただけばと思います」。

事業部視点の熱意で「データ民主化」を完遂

峯川 和久氏

古野電気株式会社

IT部 部長

峯川 和久

古野電気の峯川和久氏は、講演の冒頭で「バックグラウンドは経理畑」と語った。2015年ごろに、望ましいシステム開発のあり方や、事業部門に情報システム部門機能を融合するアイデアを上申したところ、会社から第二情報システム部の創設とその統括の提案を受ける。そして、2019年にもともと存在した情報システム部を統合してIT部となった際に、峯川氏の掲げたスローガンが「データの民主化」だった。頭の中には一橋大学名誉教授の野中 郁次郎氏のSECIモデルがあった。

「SECIモデルには、形式知や暗黙知という用語が出てきますが、これらはすなわちデータです。誰かが生み出したデータをシェアすることで新しいものができて、そこからまた新しいビジネスが生まれるということ、これこそ『データの民主化』ではないかと考えました」(峯川氏)。

そこで、基幹システムから抽出したデータをデータプラットフォームに集め、可視化・分析できるようにした。自社製品から取得できるIoTデータ用のデータプラットフォームも構築し、これをTableauで全社公開するという「データの民主化」を支える基盤を作り上げた。

その結果、2020年3月の開始時に比べて2024年9月には総プロジェクト数で5倍、カスタムビュー総数は9倍となり、データ民主化を成し遂げた。しかも、全部署がまんべんなく毎日Tableauにアクセスしており、データを見るという行動が当たり前になりつつある。峯川氏は、データ活用レベルを荒野期、開拓期、街づくり期、都市化期、近未来化期に分類しており、古野電気は都市化期までたどりついたと自己評価する。

だがこの先、近未来化期に至るためには、定量分析や多変量解析などの技術を使って気づけなかったことに気づき、AIから得られる情報で会社全体のビジネス行動変容を起こす必要がある。そこで営業報告書に着目しデータベース化の取り組みを進めている。環境をきちんと整えれば後から確認でき、AIへの投入で新しい気づきが得られ、SECIモデルを圧倒的にスピードアップできると考えた。

「結局、ビジネスにおけるAI活用とは、『知識創造スパイラル』をいかに早く、いかに多くの人を巻き込んで回転させることではないでしょうか」(峯川氏)。

自社でのデータやAIの活用に手をこまぬいていては、実践の進む海外企業らとの間で開発力や顧客対応力に大きく差がつきかねない。「ベンダーの勧めるままにAIを使うのではなく、自ら考え、企業全体を巻きこんだ人々の熱量によって、競争力を高めていくべきです」と、峯川氏は熱く呼びかけた。