ITpro Special
週間WEEKLY ITpro Special ITpro

ビッグデータはクラウドで操る!

クラウドを活用したデータ分析基盤

クラウド上のデータベースを活用し
柔軟かつ自由な分析環境を迅速に構築

クラウド上のデータベース・サービスを利用する企業が増えている。データを収集・蓄積するだけでなく、社内システムや他のクラウドと連携させてさまざまな切り口で分析したい。そんなニーズに対応してIBMは、Bluemix上で幅広いクラウド・データ・サービスを提供している。分析環境を迅速に立ち上げることができ、メンテナンスなどの手間もかからない。ユーザーのビジネススピードや使い勝手を考慮したサービスにIBMはこだわっている。

オンプレミスのアプライアンスとクラウド上の「dashDB」をつないで活用

 社内のデータ量が急増している一方で、分析などのデータ活用は不十分と感じている企業は多い。担当者はやる気でも、分析のための投資の必要性を経営層に説得できないというケースもありそうだ。そんな悩みを持つ企業にとって、クラウドを活用した分析は新しい価値への扉を開く可能性を秘めている。

日本アイ・ビー・エム株式会社
アナリティクス事業部
インフォメーション・アーキテクト
野間 愛一郎

 日本IBMの野間愛一郎氏が以下で紹介するのは、扉を開いた4つの企業の事例である。
 A社のIT部門の困りごとは、ビジネスニーズの急拡大にインフラが追いつかないことだった。

 「A社は1年ほど前、『IBM PureData System for Analytics』を導入し、ハイパフォーマンスのデータウェアハウス環境を構築していました。その使い勝手やパフォーマンスに対する満足度は高かったのですが、ビジネスの急成長により予想以上のスピードでデータ量が増大したのです」と野間氏は背景を説明する。

 このアプライアンス1台では、いずれ大量のデータを処理しきれなくなる。もう1台同じ製品を追加購入する選択肢もあるが、ビジネスの成長が今のカーブで続くとは限らない。成長に急ブレーキがかかれば、余分な資産を抱え込むことになる。そこでA社が選んだのが、クラウドのデータウェアハウス「dashDB」だった。

 「既存のアプライアンスは直近数カ月分のデータ分析に使い、それよりも古いデータはクラウドに移して分析する。そんな手法をA社は検討しています」と野間氏。オンプレミスとクラウドを組み合わせることで、投資リスクを回避することができる。A社にとっては、dashDBのフルサービスも魅力的だったようだ。

 「ハードウェアのサイジングや物理設計、ソフトウェアのインストールや運用管理などをお客様が行う必要はありません。また、パッチの適用やバージョンアップ、バックアップ、チューニングなどを含めてIBMが裏側で行います。ユーザーはdashDBに接続し、データを投入して使うだけ。これがフルサービスという意味です」と野間氏は語る。

 dashDBのコンセプトは「LOAD&GO」。従来はデータベース環境を用意するためにさまざまな作業が必要だったが、dashDBなら表をつくってデータを流し込むだけ。データベースの高速性は当然のことながら、準備段階も含めた時間短縮にdashDBはこだわっている。

 データの連携や統合の容易さも大きな特長の1つだ。たとえば、オンプレミスからクラウド上のdashDBへ、別のクラウドからdashDBへとデータを簡単に移動させて分析する場合も簡単な操作で指示するだけ。そこで大きな役割を担うのが「Bluemix」上で提供される「DataWorks」である(図1)。

[画像のクリックで拡大表示]

自社内、他社クラウド上のデータを簡単に取り込んで分析する

 DataWorksを一言でいうと「ETL as a Service」。オンプレミスや各種クラウド上に収集したデータをdashDBなどの環境に取り込むためのETL機能が、Bluemixのサービスパーツの1つとして提供される。

 「IBMの『SoftLayer』はもちろん、アマゾンやオラクル、セールスフォースなど他社のクラウド環境にあるデータも簡単に取り込むことができます。多様な環境の中に存在するデータをシームレスにつないで分析、活用することができるのです」(野間氏)

 次に、製造業B社の事例である。B社はデータ分析基盤を持っているが、かなり以前に構築されたもので、一部のデータを分析する程度であまり活用されていなかったという。B社の現場では本格的なデータ分析をしたいという声が高まっていた。

 「現場のニーズはあるのですが、予算化のハードルが高い。そこでB社はクラウドを検討しました。工場などに置かれた各種設備から得られるデータの属性は多様です。ある装置のデータ項目は100、別の装置では30という具合。バラバラな属性を持つデータを格納する際には、一般的なリレーショナル・データベースでは対応しにくい。そこでB社はCloudantのNoSQLデータベース・サービスを採用しました」と野間氏はいう。

 B社におけるデータ収集・活用の流れを図2に示した。リレーショナル・データベースでは管理する項目などをあらかじめ決めておく必要があるが、NoSQLではとりあえず“器”を用意してデータをため込むというアプローチ。多様なデータを格納するのに適したデータベースということができる。

 「NoSQLデータベースを使っているうちに、ほぼ必ず出てくるニーズがあります。既存BIツールやリレーショナル・データベースとつなげて分析したいというものですが、こうした要望にも簡単に対応することができます。ボタン1つで他のシステムとのデータ連携が可能です」と野間氏は説明する。

[画像のクリックで拡大表示]

社内のデータとソーシャルデータ、オープンデータを組み合わせて分析

 3つめの事例は、C社の品質部門。同社は全社的なニーズに対応するため、すでに高速のデータウェアハウス「IBM PureData System for Analytics」を導入していた。ただ、全社的なニーズとはいえない分野、ちょっとしたアイデアを試したいといった場合には使いにくい。トライアル&エラーの分析ができる環境を求めていたC社の品質部門が選んだのは、dashDBをはじめとするIBMのソリューションである。

 「既存の高速データウェアハウスのほか、C社は『SPSS』などのBIツールも活用していました。トライアルの際には、こうした既存システムとの連携が必要なケースもあります。そこでDataWorksなどを活用し、柔軟かつ自由なセルフサービス分析ができる環境を実現。dashDBとSpark as a Serviceをつないで専門家向けの高度な分析環境を用意することもできます」(野間氏)

 最後に、アドテク/マーケティング分野での分析に取り組んでいるD社の事例である。これは今、流通業やECサイトを含めて多くの企業がWebマーケティングに取り組んでいる。成果を上げるためのポイントとしてしばしば指摘されるのが高速PDCAだ。たとえば、Webページ上でのユーザーの動きを分析してWebページの改善などに生かす。あるいは、キャンペーンサイトを素早く立ち上げて、アクセスしたユーザーの属性や行動を分析し次のアクションにつなげる。自社商品に関する評判をソーシャルメディアで集めて、商品の改善やマーケティング施策にフィードバックしている企業も多い。

 これらは、D社のニーズでもあった。D社が導入したのはCloudantのNoSQLデータベース・サービスとdashDBによる分析用データウェアハウスである。

 「B社のケースと同様に、D社も『とりあえず、いろいろなデータを器に入れる』という考え方で、NoSQLデータベースであるCloudantを選択しました。そこに蓄積されたデータを、分析用のデータウェアハウスであるdashDBへRDB型に自動変換して格納。このdashDBにはWebサイトを訪れたユーザーが残したログなどのデータだけでなく、ソーシャルデータなど外部からのデータも取り込まれています。そこには、スマホから得られる位置情報も含まれます。たとえば、ある日、ある時間帯の渋谷周辺のつぶやきの傾向を分析するといったことが可能です」

 社内のデータとソーシャルデータ、オープンデータを組み合わせることでさまざまな気づきやアイデアが生まれる。dashDBなどのサービスにより、そのアイデアを手軽に試せる環境が実現した。

 以上の4社は非常に短期間のうちにクラウド上のデータベース環境を整えることができた。企業の多様なニーズに対応するため、IBMは豊富な機能をサービスパーツとして拡充している。それらを組み合わせれば、自社固有のニーズに応じた仕組みをつくることができる。IBMはこれらパーツ群のさらなる拡充を進めている。

お問い合わせ
  • 日本アイ・ビー・エム株式会社

    TEL:0120-300-426(平日9時30分〜17時30分)

    URL:http://www.ibm.com/jp/ja/