インフォマティカは、生成AIの導入状況に関する調査※を世界中のCDO600人に対して行った。これによると、既に45%が生成AIを導入済み、54%が導入予定となっており、ほぼすべてのCDOが生成AIへのチャレンジを始めていることが分かったという。「同時に、その全員がデータマネジメントへの投資を計画していました。生成AI活用とデータマネジメントをセットで進めることは、もはやグローバル標準になっているといえるでしょう」とインフォマティカ・ジャパンの森本 卓也氏は紹介する。



生成AIの活用が進むことで、重要性が増しているデータマネジメント。
高度な生成AI活用を具現化するため、データマネジメント基盤を見直す企業が増えている。
その際に重要になるのが、
「データエンジニアリング」「マスターデータ管理」「データガバナンス」の3つだ。
インフォマティカは、これら3つの観点から
データマネジメント基盤再構築のポイントを提唱している。
インフォマティカは、生成AIの導入状況に関する調査※を世界中のCDO600人に対して行った。これによると、既に45%が生成AIを導入済み、54%が導入予定となっており、ほぼすべてのCDOが生成AIへのチャレンジを始めていることが分かったという。「同時に、その全員がデータマネジメントへの投資を計画していました。生成AI活用とデータマネジメントをセットで進めることは、もはやグローバル標準になっているといえるでしょう」とインフォマティカ・ジャパンの森本 卓也氏は紹介する。
インフォマティカ・ジャパン株式会社
グローバル・パートナーテクニカルセールス
ソリューションアーキテクト&エバンジェリスト
森本 卓也氏
生成AI活用を視野に入れたデータ戦略で重要なのがスケーラビリティだ。データの量や種類が増えるのはもちろんのこと、ユーザーも加速度的に増えるからだ。また、連動して新たなリスクも生じる。そのため世界中の企業が、これまで個別最適で構築してきたデータマネジメント基盤を見直すとともに、運用も含めた新たな体制の構築を目指している。
「そこで重要なのは、『データエンジニアリング』『マスターデータ管理』『データガバナンス』という3つの観点から精査することです」と森本氏は言う。
まずデータエンジニアリングでは、進行が進むデータパイプラインの複雑化(図1)を解決し、技術的負債をつくらないことが肝心だ。同時に、リアルタイムなデータ連携の要請にも応える必要がある。「さらに、パイプラインの中でデータの品質を可視化・監視しつつ、問題があればアラートを上げるといった仕組みも不可欠です」と森本氏は説明する。
マスターデータ管理では、全社規模でのマスターデータ統合を進めることが重要だ。これが、DXを全社展開する上での前提条件になるからだ。
「最近は中央集権的なアーキテクチャーの課題を解決するため、事業ドメインごとにデータを管理した上でデータを連携させる『データメッシュ化』の取り組みが進展しています。その際にマスターデータ統合に着手する企業が増えています。マスターデータがばらばらなままでは、事業ドメイン間でデータを受け渡すことができず、事業横断のデータ&AI活用が進まないからです」と森本氏。また、生成AIのハルシネーションを回避する上でも、統合されたマスターデータに基づく信頼性の高いデータが重要になるという。
そしてデータガバナンスでは、生成AIによって加速するデータ民主化に備えることが肝心だ。不確かなデータによる誤った意思決定や、プライバシー規制への違反といった新たなリスクに対処することが求められている。
また、データの提供者と利用者を適切につなぐため、売買契約の仕組みでデータの安全性を管理する「データマーケットプレイス」の利用も拡大している。これらを適切に利用することで、モダンなデータガバナンスを実現することが肝心になる。特にデータカタログを選定する場合には、そのほかの将来的な適用範囲として、データ品質管理やアクセス権限管理などのデータマネジメント全体をカバーできるか否か見極めることも重要になるという。
※「CDOインサイト2024:世界中の600人のCDOから導いたAI対応の課題と解決策」インフォマティカ
これらの要件を満たすデータプラットフォームを構築するためには、どのようなアプローチが必要なのか。
「ポイントソリューションの組み合わせではなく、すべてを網羅的にカバーした単一プラットフォームを用いて環境を構築すべきです」と森本氏は強調する。前述のCDOへの調査では、約6割が「5つ以上のデータ管理ツールの使い分けが必要」だと回答していた。しかし、そこに大きな落とし穴があるという。
個別のツールを組み合わせて利用すると、運用管理の手間が肥大するほかコストもかさんでしまう。また、長期的に運用していく中では、個々のツールにデータがたまっていき、データのサイロ化に悩まされることになるだろう。「特定ツールに詳しいエンジニアが退職した場合などに、パイプラインの一部が機能不全に陥るリスクもあります。潤沢なヒト・カネを有する一部の企業を除いて、複数ツールの組み合わせによるデータマネジメント環境の構築はお勧めできません」と森本氏は述べる。
そこでインフォマティカは、このような要請に応える統合プラットフォームとして「Intelligent Data Management Cloud」(以下、IDMC)を提供している。データマネジメントに必要なプロセスの全体をカバーすることで、DXの阻害要因になるデータのサイロ化を防ぐことが可能だ(図2)。
図2 インフォマティカのIntelligent Data Management Cloud(IDMC)
データマネジメントの全体を単一プラットフォームでカバーする。これを利用して、生成AI時代に適合したデータマネジメント環境を構築する先進企業が増えている
[画像のクリックで拡大表示]
具体的には、データカタログやデータ品質、データガバナンス、さらにデータマーケットプレイスまで、多彩な機能を網羅的に備えている。単一プラットフォームのため、サービス同士は自動的に連携可能だ。データを蓄積するデータレイクやDWH、データを可視化・分析するBI/AIツールはあえて含んでいないため、データの蓄積方法や活用方法は利用目的ごとに自由に選択できるという。AWS Redshift、Microsoft Fabric、Google BigQuery、Snowflake、Databricksなどのあらゆるデータクラウドサービスを組み合わせて、自社に最適なデータプラットフォームを構築できる点が魅力的である。
IDMCが搭載するあらゆるサービスは、ローコード/ノーコードに対応している。また、使用料ベースの課金体系ですぐに利用できる点も特徴だ。多彩なサードパーティのソリューションと連携できるオープン性も強み。これによりベンダーロックインが防げる点はユーザーにとって大きな魅力となるだろう。
加えて「CLAIRE」というAIエンジンを包括していることも、IDMCの見逃せない特徴といえる。CLAIREを活用することで、自然言語によるチャット形式でデータマネジメントが行える。例えば「XX年XX月期の売上データが欲しい」「XXのデータを指定の場所に集めてほしい」「XXという品質標準をクリアするようにデータをクレンジングしてほしい」など、様々な操作を生成AIとの会話形式で実行することが可能だ。これまで以上に多くのユーザーが、データマネジメントに携わることができるようになるはずだ。
「まずは自社のデータマネジメントの状況をチェックして、どのような状態にあるかを把握することをお勧めします」と森本氏は語る。その上で、生成AI時代にフィットするモダンなデータマネジメント基盤を構築する際には、インフォマティカの提案が参考になるだろう。
インフォマティカ・ジャパン株式会社
URL:https://www.informatica.com/ja/
問い合わせフォーム:https://www.informatica.com/ja/contact-us.html
TEL:03-6403-7600