近年、DX(デジタルトランスフォーメーション)やAI(人工知能)のニーズが高まるにつれ、統合データ基盤の重要性が認識されつつある。しかし、せっかく構築したデータ基盤が有効に運用されていない例も散見される。primeNumberは構築と運用を両輪とする方法論「DATA ORCHESTRATION CLOUD Methodology」を提唱、貴重なデータ人材を有効活用し、ROI(Return on Investment:投資利益率)の向上を実現するソリューションを提供している。同社の中村祐太氏にデータ基盤構築・運用のポイントについて聞いた。
非効率な作業でデジタル人材が消耗している
株式会社primeNumber
カスタマーサクセス本部
カスタマーサクセスグループ
アダプションチーム
Senior Manager
中村 祐太 氏
DX推進、AIの業務活用など、データをビジネス課題の解決に活用する際には、データサイエンティストやデータアナリストなどのデータ人材の活躍が重要となる。primeNumberの中村祐太氏は、講演の冒頭、これらのデータ人材が直面している課題を明らかにした。
「データサイエンティストやデータアナリストは、データ統合、前処理、クレンジングなどの準備作業に多くの時間を費やしています。本来、データサイエンティストは企業の未来を見据えた予測モデル構築や新たな価値創造など、データアナリストは経営陣や現場の担当者への具体的なインサイトの提供に注力すべきですが、専門性を生かしきれない状況にあります」(中村氏)。
その原因として中村氏は、「組織内におけるデータのサイロ化」と「統一的なデータガバナンスの欠如」を挙げる。各部門が個別にデータを管理し、全社にわたる一体的なデータ活用が実現できないと、組織の迅速な意思決定を阻害しかねないからだ。
同社では、データ人材の価値を最大化して、データドリブン経営を実現する手法として、「DATA ORCHESTRATION CLOUD Methodology」を提唱している。これは「“データで価値を出す”ために必要なデータ基盤構築と運用の方法論」である。
【画像をクリックすると拡大します】
構築と運用を両輪としてデータ利活用を加速する
統合データ基盤を構築することの重要性は広く認識されているが、基盤構築後、データが陳腐化するケースも見られる。「データ活用を0から1にする構築だけでなく、1から10、10から100と絶えず価値を創造し、最大化していく運用にも重きを置いています」と中村氏が語るように、構築と運用の両輪でデータ活用による課題解決を実現するのが、DATA ORCHESTRATION CLOUD Methodologyの狙いだ。
データ基盤の構築について中村氏は、「基盤の構築自体を目的とせず、何のために基盤を作るのかを明確にすべき」と述べ、構築時に配慮すべき3つのポイントを挙げた。
1つ目は、データ活用の目的に合った基盤を作ること。「例えば、データウエアハウスへの書き込みに関して、データ活用の目的が顧客の状況を確認したいということであれば、デイリーでの更新で対応できますし、ゲームイベントをタイムリーに把握したい場合にはリアルタイムでの更新が必要でしょう。目的によって書き込み要件が変わるため、コストに見合う基盤構築になっているかどうかが重要です」(中村氏)。
2つ目は、データ活用の目的や期待値を調整すること。例えば、AI活用に必要な動画や音声などの非構造化データを扱う場合、ゴールが明確でないまま非構造化データを無計画にオブジェクトストレージへ蓄積し続けると、保管コストや管理コストの増加につながる可能性がある。「構築者目線で活用者のAI活用を深く理解し、最適なデータ基盤を作らなくてはいけません」と中村氏は語る。「AIで良い感じにしてほしい」といった曖昧な指示では、無駄な作業と労力を積み上げるばかりとなる。
3つ目は、構築時のコスト管理である。例えば、ソースコードの公開されているOSS(Open Source Software)のほうが構築コストは抑えられるが、基盤拡大時の改廃コストは見合うのか。逆に信頼性から商用サービスを選んだ場合は過剰な仕様になっていないかを検討する必要がある。「最初から最適解を選ぶのは難しく、初期構築の時点で検討と実装を繰り返しながら、自社に合ったデータ基盤を構築し、育てていく姿勢が重要です」(中村氏)。
業務生産性だけでない組織全体へのメリット
続いて「データの運用」のポイントに挙げたのは「データモデリング」「データガバナンス」「メタデータ管理」の3つである。
データモデリングとはデータベース設計や命名規則を策定し、データの整合性や拡張性、保守性を確保する作業のこと。適切に実施できれば、現場でのクリーニング作業の負担は軽減され、迅速な意思決定、高品質なインサイト提供が可能となる。
データガバナンスをシンプルに表現すれば「データを活用するに当たってのルール決め」である。各部門でバラバラにデータが活用され、部門ごとにテーブル命名規則やパイプラインが異なると、横断的なデータ活用をする際の障壁になる。中村氏は「シンプルなルールを設け、日常運用において徹底することで、信頼できるデータ環境が構築されます」とその重要性を語る。
データそれ自体の情報であるメタデータが適切に管理されていることで、どのデータがどこから来てどのように利用されるかが明確になり、データの透明性と信頼性が向上する。特に最近では、構築したデータ基盤とAIのかけ橋としての重要性が高まっている。中村氏は、様々なメタデータをどう同期・生成するかの検討と同時に、体系的に管理できるようにデータカタログツールの導入も考えるべきだとする。「メタデータ管理は後手に回りやすいのですが、組織全体のデータ活用力を高めるには不可欠な要素です」と強調した。
中村氏は、構築と運用を両輪とするDATA ORCHESTRATION CLOUD Methodologyを用いることで、データ利用の意思決定のリードタイム短縮や運用への継続投資によるアウトプットの加速など、業務効率の向上が可能だと強調する。また、導入効果はデータドリブンな企業風土の醸成にもつながる。部門間のデータサイロの解消や統一的なデータガバナンスの強化、統一データに基づく迅速かつ戦略的な意思決定でROI向上が期待できるなど、組織全体のメリットも強調した。
primeNumberでは、「データ基盤」へデータを連携・統合・運用管理するSaaS(Software as a Service)事業の「TROCCO」や、メタデータの発見・理解・活用を支援するクラウドデータカタログ「COMETA」、データ利活用にまつわるステップごとの課題解決を支援し、自走できる状態を目指すプロフェッショナルサービス事業を展開し、企業のデータ基盤の構築から運営までを一体的にサポートしている。
【画像をクリックすると拡大します】
中村氏は「自社のデータ基盤を見直し、運用プロセスにしっかりと投資することで、日々のアウトプットの加速や意思決定の迅速化を実感していただきたい」と語り、講演を締めくくった。

