ITpro Special
週間WEEKLY ITpro Special ITpro

クラウドファースト時代のイノベーションの起こし方 企業変革を実現するクラウド利用の勘所

選びやすく買いやすい“スイート”で ビッグデータ関連サービスを提供する

ビッグデータ

選びやすく買いやすい“スイート”で
ビッグデータ関連サービスを提供する

大量のITリソースを迅速かつ柔軟に入手できることから、ビッグデータを活用しようとする企業の多くは、そのための基盤にクラウドを選んでいる。ただ、膨大なサービス群の中から目的に合ったものを選ぶのは容易ではない。利用者のそうした悩みに応えるのが、2015年7月に発表された「Microsoft Cortana Analytics Suite」。収集からアナリティクスと可視化までのすべてをカバーする統合型のソリューションになっているのもポイントだ。

「総務省によれば、2014年のビッグデータの容量の見込み値は14.5エクサバイトに達するそうです。この数値は、9年前の容量の9.3倍以上に相当します」

 日本マイクロソフトの大谷 健氏は、国内ビッグデータ市場をこう俯瞰する。ただ、トータルの容量では成長率が高いものの、すべてのデータ種類が同じように利用されているわけではない。「顧客データや経理データは50%近くの企業が活用しているのに対し、容量の大半を占めるセンサーや監視カメラのデータの利用率は社数ベースで1%から2%にとどまります」(大谷氏)というのだ。

日本マイクロソフト株式会社
クラウド&エンタープライズビジネス本部
クラウド&サーバー製品マーケティング部
エグゼクティブプロダクトマネージャー
大谷 健

 そうした濃淡が生じる理由として、大谷氏は「技術的」と「経済的」の2つの障壁の存在を挙げる。技術的障壁とは「データが散在している」「どのように分析・利用すればよいかわからない」という実施面での悩み、経済的障壁とは「利用による費用対効果が読めない」「分析や利用の費用が多額」といった費用面の問題だ。

 そこで、マイクロソフトのクラウドサービス「Microsoft Azure」では「スイート」というサービスを提供し、料金体系は月額定額制にしたと大谷氏は説明する。スイートとは関連性のあるクラウドサービスを一揃い(スイート)にまとめて選びやすくしたもので、オンプレミスでのソフトウェアパッケージに相当する。また、実際に使った分だけ払えばよい月額定額制なら企業にとっても予算化しやすい。

ビッグデータに関するサービスを集めたスイートが登場

 そうしたスイートの1つに、ビッグデータ関連のAzureサービスを集めた「Microsoft Cortana Analytics Suite」(米国時間の2015年9月29日より提供開始した。)がある。大谷氏によれば「発生源から分析や利用をするところまで、つまり最初から最後までを一貫したサービスで結ぶデータのバリューチェーン」のサービス群だ。

■Cortana Analytics Suiteの構成
ビッグデータにかかわるAzureサービス群をまとめた「スイート」なので、選びやすく、使いやすい
[画像のクリックで拡大表示]

 Cortana Analytics Suiteに含まれるサービスは、役割別に、「データマネジメント」「ビッグデータストア」「機械学習/アナリティクス」グループに分けられている。

 データマネジメントに属するサービスの担当分野はデータ収集だ。データソースは業務アプリケーションのデータでもセンサーなどのIoT(Internet of Things、モノのインターネット)データでもよく、Azure Data Factoryを使ったデータクレンジングも可能だ。Azure Event Hub(データストリーミング)とAzure Data Catalog(メタデータカタログ)も、このグループに属するサービスだ。

 このデータマネジメントのアウトプットは分析に最適化されたビッグデータストアのAzure Data LakeとAzure SQL Data Warehouseの2つのサービスによってAzureに格納され、機械学習/アナリティクスのAzure Machine Learning、Azure HDInsight(Azure版Hadoop)、Azure Stream Analytics(データストリーミング)が分析や解析を進めていく。

 そのほかのサービスとして、Cortana Analytics Suiteにはダッシュボードによる見える化やPerceptual Intelligenceによるディープラーニング、音声などによるパーソナルデジタルアシスタンスのCortana、ダッシュボードによる見える化、ビジネスシナリオにあわせた、リコメンデ―ションなどのビッグデータソリューションなども含まれている。

非構造型/半構造型のデータ用にデータレークのプレビューも進む

 一般に、ビッグデータのハンドリング方法は「ホット」と「コールド」に大別される。

 ホットのほうは大量のトランザクションやメッセージをリアルタイムで連続的に処理することを目的としており、データはサーバーのメモリ上に置かれるのが一般的だ。メモリ上のデータは後で上書きされてしまうので、同じデータに対するアナリティクスは1回しかできない。

 一方、バッチのほうは収集したビッグデータをいったんどこかに溜めておき、あとで様々なアナリティクスを行うという方法だ。データの格納場所はデータレーク、データベース(DB)、データウェアハウス(DWH)、データマート(DM)などから選べるので、アナリティクスの目的によって使い分けるとよいだろう。

 Cortana Analytics Suiteは、データレークとしてAzure Data Lake、データウェアハウスとしてAzure SQL Data Warehouseが用意されている(スイート外のデータソースとしてはMicrosoft Azure SQL Databaseも利用可能)。

マイクロソフト・コーポレーション
Principle Program Manager(Azure Data Lake 担当)
ラジェッシュ・ダディア

 Azure Data LakeはHadoopのファイルシステムであるHadoop Distributed File System(HDFS)をAzureに移植したもので、Azure HDInsightのほか、Hortonworks、Cloudera、Revolutionなどとの直接連携が可能だ。

 おもな特長として挙げられるのは、「非構造型や半構造型のデータも格納できる」「エンジニアが使い慣れたVisual Studioで管理できる」「Azureリージョン内で自動的に3コピーが作られる」「容量に制限がなく、ペタバイト級のビッグデータも溜められる」など。マイクロソフト・コーポレーションのラジェッシュ・ダディア氏は「現在進められているプライベートプレビューの後、2015年内にはパブリックプレビュー、2016年春には一般提供(GA)となる予定です」と話す。

超並列処理(MPP)の大パワーでビッグデータを高速・柔軟に処理

 これに対して、Azure SQL Data WarehouseのほうはSQL ServerベースのデータウェアハウスをDWHaaS(DWH as a Service)として提供するサービスに位置付けられている。

マイクロソフト・コーポレーション
Program Manager(Azure SQL Data Warehouse 担当)
ニコル・ホイットマン

 Azure SQL Databaseとの最大の違いは、「SQL Databaseのほうが対象型マルチプロセシング(SMP)アーキテクチャであるのに対し、SQL Data Warehouseは超並列処理(MPP)型になっている」(マイクロソフト・コーポレーションのニコル・ホイットマン氏)こと。データ件数が多くなればなるほどMPPならではの並列性が効いてくるとホイットマン氏はいう。

 また、利用者の立場からは、容量や速度を柔軟に変えられる柔軟な仕組みになっていることも魅力的なポイントだ。使っていないときにシステムを“一時休止”させるPause機能も備えているので、キャンペーンやイベントのように突発的に処理量が増減したり期間が限られていたりする用途には最適のDWHとなることだろう。

ケーススタディ&ソリューション

ケーススタディ

関電システムソリューションズ

Azure採用の4つのポイントとは

ソリューション

関電システムソリューションズ

コスト削減と資源管理が可能なクラウドとは

ソリューション

クリエーションライン

クラウドでDevOpsを使うには

ソリューション

クララオンライン

中国でも安全にAzureを使いたい

ソリューション

さくらインターネット

Azureと連携したプライベートクラウド

ソリューション

ブロードバンドタワー

賢くAzureを使うための従量課金対策

ソリューション

ソフトバンク コマース&サービス

Azureの知りたい情報が満載

ソリューション

日本ビジネスシステムズ

クラウドの運用管理に困っていませんか

ソリューション

ハートビーツ

Azureのマネージドサービスを提供!

ソリューション

トレジャーデータ

ビッグデータ分析を手軽に導入したい!

ケーススタディ

シーイーシー

Azure上で提供される会計処理システム