■

新たな価値創出は、「お客さまを知る」ことから
みずほ銀行の「One to One マーケティング」を
実現するデータレイク基盤とは

組織変革と先進テクノロジーが、
「顧客主体」サービス提供の鍵に

オムニチャネルの難しさは大きく2つある。1つはデータ統合であり、もう1つはテクノロジーの選択だ。

吉澤氏のチームは、データベースを駆使し、データからいかに新しい価値を創出するかという重大な使命を持っている。そこに立ちはだかるのは、各チャネルから日々生み出される膨大なデータをどのように統合・活用していくのかという問題である。また、それらのデータは、構造化データだけでなく非構造化データが含まれていることも、さらに問題を複雑にしている。

「対面での顧客対応を支援するために十数年前からCRMシステムに情報を蓄積してきました。しかし、今ではPCやスマホといった非対面での接点が増えています。これらすべてのチャネルでシームレスなサービスを提供していくことが重要です」と吉澤氏。そのためには、顧客の興味・関心や考え方、動向を把握したうえで、最適な商品やサービスをレコメンドする仕組みを構築しなければならない。

その大前提となるのが、顧客軸でデータを統合し、分析できるようにすることだ。同行では数年前からデータの整理統合に取り組んできたという。「まず各部署でつくっていた膨大な数のファイルを、顧客管理、戦略管理、収益管理、接点管理といった観点から整理し、データベース化してきました。クレームなどのアラート情報のデータベースもあります」(吉澤氏)。

現在、同行では毎月発生する3億件のトランザクションを正規化し、データベースごとに分類して日次で更新している。そんな巨大なシステムを支えているテクノロジーとはいったい何なのか。

非構造化データ活用を推進するテクノロジーとして、
Hadoopの採用を決定

みずほ銀行のIT部門でオムニチャネル向けデータ基盤を担当する家村育民氏は、「われわれの取り組みは、2009年のデータウェアハウス・アプライアンスの導入にさかのぼり、以前からお客さま一人一人を軸とした分析を行ってきました。しかしこれまでは、主に業務システムなどから得られる構造化データの分析がメインでした」とこれまでの取り組みを振り返る。

みずほ銀行 IT・システム統括第一部 戦略情報基盤システム推進チーム 調査役 家村育民氏

そんな中、本当の意味で顧客を把握するためには、「Webサイトの閲覧ログやSNSから得られる情報など、非構造化データを含む分析が必要と考えるようになりました」と家村氏は語る。

「お客さまがどんな情報に関心をお持ちで、みずほ銀行のサイトを閲覧しているのか、世の中ではどんなトピックが話題になっているのか。そんな視点も加えながらお客さまに向き合うためにIT基盤はどうあるべきなのかを考える中で、Hadoopの導入を早い時期から視野に入れていました。活用できる約5,000種類のデータについて、データの種類やライフサイクル、利用頻度を整理し、数百テラバイト規模のデータを効率的に格納・利用できることを要件としてパフォーマンスのテストや稼働プラットフォームの検討を行ってきました」(家村氏)

一方、吉澤氏は「Webログ、SNS、IRレポート、調査会社データ、ニュースといったさまざまな外部情報を活用していきたい。そこではデータを構造化していく時間はありません」と語る。さらに外部のデータを内部のデータと紐づけて分析するためのファジーマッチングも視野に入れなければならなかったという。

IBMのHadoopアプライアンス・ソリューションを採用

これを実現するため、みずほ銀行はIBMのHadoopアプライアンス・ソリューション「IBM Data Engine for Analytics(以下、IDEA)」を導入し、データレイクを構築した。IDEAはあらかじめ、サーバー、ストレージ、ソフトウェアが最適に組み合わされた状態で出荷されるため、迅速なシステム実装が可能であり、高い運用効率とパフォーマンスを併せ持つことが特長だ。SQLベースでHadoopを活用できるBig SQL機能を実装したIBM BigInsightsに、大容量データ処理向けに設計されているIBM Power Systems、スケーラブルかつ高性能なIBM Spectrum Scaleを採用した、外部分散ストレージ環境Elastic Storage Serverが組み合わされており、通常のx86サーバーでファイルサーバーを構築するのと比べて高いパフォーマンスを実現すると同時に、約1/3のディスク容量で同等のHadoop実効容量を実現できる。

(図1)多種多様なデータを利活用し、顧客の洞察を深め続ける“データレイク”を構築

「IDEAを導入した理由は2つあります。まず、ファイルサーバーとして活用することで、多種多様かつ大容量データの保管コストを最適化できることです。そしてもう1つが、SNSのデータと内部のデータをファジーマッチングする機能など、すぐに実践できる仕掛けがあらかじめ搭載されていて、ユーザーニーズをスピーディーに提供できる点です」と家村氏は語る。

今回構築したデータレイクと、Webログの収集分析ツールIBM Marketing Cloud(旧称:Silverpop)、顧客に対する自動マーケティングソリューションIBM Digital Analyticsを組み合わせて活用することで、複数チャネルから収集した多様なデータを高速に格納、処理して有機的に連携させる仕組みが完成し、One to Oneマーケティングを実現する基盤が整った。

(図2)IBMのアプライアンス・ソリューション IDEAの特長

今後の展望について吉澤氏は「新しい技術で実現できることを決め打ちするのではなく、PoC(Proof of Concept:概念実証)をいくつも重ねながら、活用領域を貪欲に増やしていきたい。そしてそのためには、今後もIT部門との継続的なパートナーシップが不可欠です」と語る。「非構造化のテキスト分析が、最新のテクノロジーでどこまで実現できるのか注目しています。また、コールセンターの業務支援として導入しているIBM Watsonから得られるノウハウも、将来的には活用したいと考えています」と家村氏は語る。

先日、銀行法が改正され、銀行の業務の制限が緩和された。貪欲に最新技術の活用に取り組む同行がどんな顧客主体のサービスを提供していくのか今後の展開に期待したい。

お問い合わせ先
日本アイ・ビー・エム株式会社