IBM Cloudで実現するデジタル変革

第4回 既存のデータを活用してビジネスを変革
クラウドを活用したデータプラットフォームのあるべき姿とは

AIの活用は今後のビジネスを大きく変える可能性を秘めている。しかし、活用できるデータがあることがその前提だ。実は、AI活用の先進的な取り組みでもデータをそろえることに苦労しているケースは少なくない。ITがビジネスの基盤となっている今、データを活用したデジタル変革を推進する上での課題はどこにあるのだろうか。クラウド時代のデータプラットフォームのあるべき姿とその役割について考えてみたい。

データの真の価値を引き出すには、大量かつ多種多様なデータへの対応が必要

 企業活動に伴って生み出されるデータは質量ともに増大している。まず、自社の企業活動に伴い発生するデータがある。企業の基幹システムのデータはもちろん、営業活動やコールセンターなどを通じた顧客とのやりとりのデータも重要だ。自社のWebで発生するものもある。またIoTによって様々なモノから生じるデータは、今後爆発的に増加していくだろう。

 さらに、こうした自社の企業活動に伴って発生するデータだけではなく、市場のデータや気象データ、交通データ、ソーシャルネットワーク上での風評データなどもビジネスを左右する重要な要素になる。データをビジネスに活用するには、データの発生源が分散し、データフォーマットが異なるこれらのデータにも対応しなければならない。

 そこで注目されているのが、データプラットフォームとしてのクラウドの活用だ。クラウドであればインターネット経由でデータを手軽に格納でき、データ量の増減にも柔軟に対応できる。とりあえずクラウドにデータを保管しておいて、必要なときに必要なデータを取り出して分析することができる。

 しかし、ここにも問題がある。企業の基幹システムの多くはオンプレミス(自社運用)にあり、データは独自のデータベースに格納されている。データを活用するためにはこれらのオンプレミスのデータとクラウド上のデータをシームレスにつなぎ、透過的に利用できるようにしなければならない。データは「ためる」「つなぐ」というステップがあり、初めて「活用する」ことができるのである。

 多くの場合、現状はこうした理想的な姿とはかけ離れている。データ形式には基幹システムのデータのような構造化されたものもあれば、テキストや映像のように非構造的なものもある。また、データの発生頻度や求められる分析速度も異なる。それぞれの特性に対応したデータベースがあり、それを運用するプラットフォーム、活用するための分析ツールがある。結果として、透過性のないバラバラなデータプラットフォームが散在することになる。

 こうした課題を解決するために、IBMではHybrid Data Managementを実現する分析プラットフォームアーキテクチャーを提供している。そこではオンプレミスからクラウドまで同一のデータプラットフォームが提供され、社外を含めた多種多様なデータベースのデータにアクセスすることができ、分析まで行うことができる。

(図1)最適なデータ活用の前に、データ基盤の様々な制約が立ちふさがる
最適なデータ活用の前に、データ基盤の様々な制約が立ちふさがる
[画像のクリックで拡大表示]

データの場所、種類を意識することなく透過的に利用できるエンジンを提供

 あらゆるタイプのデータに対応し、オンプレミスでもクラウドでも透過的にアクセスできるデータプラットフォームを実現するカギとなるのが、IBM Common SQL Engineというテクノロジーだ。

 オンプレミスで利用されているIBMのデータベース「Db2」も、パブリッククラウドで提供されているデータベース「Db2 on Cloud」とデータ分析用の「Db2 Warehouse on Cloud」も、IBM Common SQL Engineという同じエンジンによって稼働している。

 企業向けデータベースとして信頼されているDb2を、オンプレミスだけではなくクラウドでも活用できることで、オンプレミスとプライベートクラウド、パブリッククラウドを組み合わせたハイブリッドクラウドの全てで、共通のSQLによって透過的にデータにアクセスできるようになる。

 このDb2の世界をさらに広げているのが、Db2と他のデータベースの連携を可能にする、Db2の強力なフェデレーション機能だ。Db2はOracle PL/SQLとの互換性が高く、Oracleデータベース向けに開発したアプリケーションを手直しすることなく、そのまま実行している事例も多い(図2)。

(図2)Hybrid Data Management
・データベース全体で共通のSQLアクセスを提供・Sparkにて機械学習の効率化・クラウドからオンプレまですべての環境で提供可能
[画像のクリックで拡大表示]

 またDb2によって透過的に様々なデータアクセスができるテクノロジーを生かし、最先端の高度かつ、高速な機械学習環境を1台で迅速に立ち上げられるソリューションも用意されている。それが「IBM Integrated Analytics System」である。

 IBM Integrated Analytics Systemはクラウドにつながった分析のためのアプライアンス製品で、Common SQL Engineとともに機械学習のスタンダードであるSparkがすぐに使える状態で実装されている。Db2のインメモリBLUテクノロジーによる高速なデータウェアハウスとSparkが共有メモリで接続され、大量のデータを無駄に転送することなく高速に機械学習で分析できる環境が、すぐに手に入るのである。

 しかもIBM Integrated Analytics Systemでは複雑な構築・運用手順は不要で、データの投入後すぐに分析を開始可能という簡易性から、圧倒的なTCOの削減も実現できる。圧倒的なパフォーマンスと簡易性、そしてクラウドで広がる無限の可能性。将来を見据えた最先端の機械学習環境を迅速に立ち上げるには、まさにうってつけの1台となる(図3)。

(図3)最先端の機械学習をこの1台で簡単に — 機械学習の常識を変える圧倒的な“スピード”
最先端の機械学習をこの1台で簡単に 機械学習の常識を変える圧倒的な“スピード”
[画像のクリックで拡大表示]

データを活用する文化を醸成する「AnalyticsOps」のプラットフォーム

 異なるデータベース間でのデータの透過性、データ分析環境の自動運用化、そして手軽に機械学習を始められるデータプラットフォームの登場は、企業活動にどのようなメリットをもたらすのだろうか。キーワードはDevOps(デブオプス:開発と運用の連携)ならぬ、AnalyticsOps(アナリティクスオプス:分析と運用の連携)だ。

 AnalyticsOpsでは、データをためて、つなげて、活用するというサイクルが継続的に反復されていく。ビジネス課題に応じて、データが集められ、変換され、インプットされ、分析モデルが開発されてアナリティクスが行われ、その結果がアウトプットとしてフィードバックされる。

 こうした一連のサイクルをビジネス・アナリスト、データ・エンジニア、アプリケーション開発者、データ・サイエンティストが共有し、ともにビジネスを進めていくことにより、企業活動の中にデータの分析と活用を組み込む文化が醸成される。それがデジタル変革を加速し、企業の競争力を高めることにつながっていく。

 その前提となっているのが、これまで述べてきたIBMのテクノロジーだ。データの収集から分析まで全てを1つの仕組みの中で実現する。しかも、これまでの機械学習の常識を超える圧倒的なスピードを提供することにより、データの分析と活用がより身近なものになる。

 また、IBMにはこうした文化をさらに加速させるソリューションとしてWatson Data Platformもある。大量データの保管、分析のための前処理、最適な機械学習アルゴリズムの自動推奨、練られた分析モデルのRest APIでの迅速な公開といった、データの発生からデータが価値を生み出すまでの一連のデータパイプラインをサポートする、AI時代の次世代クラウド分析基盤がAnalyticsOpsの実現へとつなげていく(図4)。

(図4)IBM Watson Data Platform
最先端の機械学習をこの1台で簡単に 機械学習の常識を変える圧倒的な“スピード”
[画像のクリックで拡大表示]

 今、求められているデータプラットフォームは単にデータをためる器ではない。データ活用を中心として社内の様々な役割の人をつなぐワークベンチ(開発環境)であり、データを活用しながら合理的にビジネスを高度化させるという働き方改革のベースとなるものだ。データの真の価値を引き出すために、データプラットフォームを見直す時期にきている。このチャンスを生かせるかどうかが、企業の将来性を左右する分かれ目になるだろう。

(図5)データ活用に携わる人々の相互理解が重要に
分析・評価に関与する人々の協調が重要に~データ活用を促進する文化の醸成~
[画像のクリックで拡大表示]
お問い合わせ