デジタル化の進展に伴い、企業の関心事はデータを「ためる」から「活用する」へと移りつつある。
データを活用し、ビジネス効果を引き出すためには、まずビジネスを理解し、データを理解することが欠かせない。その上で、データを適切にモデリング・評価し、現場にデプロイして、さらには継続的なモデル改善にも取り組むことが重要である。
しかし、このプロセスにはあるボトルネックが潜んでいる。「大量かつ多種多様なデータのクレンジング、分析アルゴリズムの選定、データモデリングの評価・適用など、分析のためのデータ準備やデータアクセスに、全プロセスの6割程度の時間と労力が費やされているのです」とSAPジャパンの椛田 后一氏は指摘する。
この工程をどう効率化・高速化するかが、ビジネス環境の変化に即応したデータ活用を図るための重要ポイントとなる。SAPのインメモリー・プラットフォーム「SAP HANA」は、この課題解決を図るソリューションになるという。
具体的には、すべてのデータをメモリー上で処理するインメモリーコンピューティング技術により、従来型のリレーショナルデータベースと比べて、数千倍から数十万倍のパフォーマンスを発揮することが可能だ。
「データベース内部でのデータ格納方式として、従来のデータベースは行単位でデータを分割管理しますが、SAP HANAは列単位でデータを配置し、高度な圧縮技術でデータを管理しています。OLTPにも対応しているので、鮮度の高いリアルタイムデータに対して効率的にアクセスし、メモリー上に展開された高圧縮の大量データに対して高速な処理が実現できます」と椛田氏は説明する。
CPUの最新テクノロジーを有効活用していることも大きな特徴だ。複数のCPUコアで並列処理することで性能を存分に引き出し、複数データを一括処理する。
加えて、データ分析基盤として様々な機能を実装している点も強みだ。90を超える機械学習、予測分析アルゴリズムを実装しているほか、多様なデータとの連携方式をサポートしており、外部データをSAP HANA上に統合することも可能だ。
「煩雑なデータ準備作業と、機械学習・予測分析アルゴリズムによる分析処理の両方を、単一のプラットフォーム上で高速に実現できるのです。サイロ化しがちなデータソースを一元化できれば、分析業務は大きく効率化できるでしょう」と椛田氏は述べる。
また講演では、SAP HANAのユーザーであるNTTドコモの事例に触れ、業務部門がデータを利活用するには高速なデータアクセスが必須条件であり、価値であることを紹介。ほかにも、グローバルにおけるいくつかの事例が紹介された。
世界最大規模の小売事業者、ウォルマートはその1社だ。同社が過去3年以上にわたり蓄積したPOSデータのメインテーブルは2500億件以上。しかも、各店舗からは1時間当たり2000万件の新たなデータが送られてくる。SAP HANAを活用することで、この膨大なデータに1500人がアクセスしても、94%のクエリを2秒以内で完了できる環境を整えた。
「夜間バッチで長時間かけていたデータマートの作成作業が不要になり、リアルタイムなデータ分析も実現しています。鮮度の高い情報を扱うことで、市場の変化への適応力が高まったほか、仮説検証なども高速に行える環境ができています」(椛田氏)
また、ネットワーク機器の世界的ベンダーであるシスコシステムズも、SAP HANAによるビジネス変革で大きな成果を上げている。具体的には、社内に散在する多種多様なデータを統合することで、日々の販売目標を分かりやすく可視化。見込み顧客に対し、それぞれに最適な提案内容をレコメンドするという戦略的営業活動によって、顧客体験の質の向上と高い成約率を達成している。「既に1000億円以上の新規案件創出に成功しているそうです」と椛田氏は強調する。
一方、IoTのセンサーやWebサイトなどから得られるビッグデータの活用を進める上では、顧客情報や売上情報といった既存のエンタープライズデータと関連付けることも必須となる。ビッグデータは非構造化データ、一方のエンタープライズデータは構造化データであり、その連携をスムーズに行うには多くの手間が必要になりがちだ。
そこでSAPは、これを支援するソリューションとして、ビッグデータ処理基盤「SAP Data Hub」を提供している(図1)。Hadoop、およびアマゾン ウェブ サービス、Microsoft Azure、Google Cloud Platformなどのクラウドに格納された大量の非構造化データをインメモリー技術で高速に処理することができる。「ビッグデータとエンタープライズデータの間の『パイプライン』となり、統合アクセスを実現します」と椛田氏は話す。
SAP Data Hubでは、非構造化データを活用可能な状態にするための加工・集計といった作業がGUI/ノンプログラミングベースで行えるほか、どこのデータソースから、どのような過程でデータを加工・集計したかもトレースできるため、データガバナンス強化も図れる(図2)。「ビッグデータとエンタープライズデータを組み合わせた活用環境を提供し、企業のデータ活用を一段上のステージへ高めます」と椛田氏は述べる。
同社が提供する一連のインメモリー・ソリューションは、データ活用でビジネス変革を目指す企業の強力な武器になるだろう。