非構造化データの爆発的増大で企業が直面する「2つの課題」とその解決策

急速な勢いで増加し続ける非構造化データ。コロナ禍はそれをさらに加速する結果となった。これに対応するためストレージを追加していったことで、「データのサイロ化」や「管理の複雑さ」といった課題に悩む企業も少なくないはずだ。新たなデータ爆発に伴う問題をどう解消していけばよいのか。ここでは非構造化データの蓄積・管理・活用に関する新しいアプローチを紹介したい。

コロナ禍による生活や働き方の変化で
非構造化データが急増

新型コロナウイルスによって、生活や働き方は大きく変わった。これに伴い、蓄積・活用されるデータも大きく変化している。RDBが扱う構造化データに比べ、テキストや画像、動画といった非構造化データが、この間に爆発的に増えているのだ。

Dell Technologies
Head of Sales & General Manager
Unstructured Data Solutions
APJC
Jay Tuseth氏

「非構造化データは構造化データに比べ、約2倍のペースで増えています」と語るのは、デル・テクノロジーズのアジア・パシフィック地域で、非構造化データ領域でのセールスリーダーを務めるJay Tuseth氏。その理由は大きく2つあるという。

「1つはアプリケーションのシフトです。DXが進んできたことで、企業内でも非構造化データを使う新しいアプリケーションの利用が広がっています。もう1つは、人々が物理的に離れていることで、新しいつながり方が一般化したこと。具体的にはWeb会議や写真を使ったコミュニケーションが増えており、これも非構造化データの増大に拍車をかけています」

このような状況の中、企業システムはデータの蓄積・活用に関して、大きく2つの課題に直面することになった。1つ目の課題はサイロ化だ。急速に増大する非構造化データに対応していった結果、複数のストレージシステムが乱立し、システム全体が複雑になっている。2つ目は、アプリケーション間のデータ共有の課題。最近では運用するストレージシステムの数が増えているだけではなく、その場所がパブリッククラウドにまで広がっている。これもサイロ化を加速し、アプリケーション間のデータ断絶をもたらす結果となっている。

「この問題を解決するには、容量・パフォーマンスともにスケールアウト可能で、柔軟性と管理性に優れたストレージシステムが必要です」とTuseth氏は言う。このような特徴を持つストレージに膨大な非構造化データを集約すれば、複数アプリケーション間でのデータ共有も容易になるわけだ。「ただし、同時にデータ保護を徹底することも重要になります。ハードウエア障害などでデータを消失しないことはもちろんですが、ランサムウエアのようなサイバー攻撃に遭っても、データを防御できなければなりません」(Tuseth氏)。

膨大で多様なデータを
1クラスターに集約可能

このようなニーズに応えるため、デル・テクノロジーズが提供しているのが「Dell EMC PowerScale」(以下、PowerScale)である。柔軟性、管理性、パフォーマンスとデータ保護に焦点を当てて設計されており、これらを極めてシンプルな形で実現していることが、大きな特徴だ。さらに2021年9月には、こうした特徴をさらに強化するいくつかの機能追加が行われた。

特に注目したいのは、大きく3種類のストレージノードが用意され、これらを単一クラスターで共存させられる点だ。そのノードとは、パフォーマンスに優れた「オールフラッシュノード」、フラッシュとHDDを組み合わせた「ハイブリッドノード」、そして速度は高くないものの大容量化を実現した「アーカイブノード」である。簡単にいえば、用途別に機能の異なる3つのストレージが一体化したイメージだ。これにより、異なるタイプのワークロードやニーズへの対応が可能となるという。

またエッジとデータセンターの両方に設置して、リアルタイムにデータをレプリケート(複製)することも可能。さらにその先をパブリッククラウドへと拡張することもできる。PowerScaleのストレージOSである「OneFS」には、ネイティブクラウドサービスやマルチクラウドアクセスといった、クラウド連携のための機能も装備されているからだ。

これによってあらゆるワークロードに対応できるストレージシステムを実現できる。またパブリッククラウドとの連携も容易に行える

1つのクラスターに複数タイプのノードを集約することは、管理性の向上にもつながる。その理由は当然のことながら、管理対象が少なくなるからだ。またPowerScaleにはOneFSのコンソールが用意されており、これによって一元管理がさらに容易になる。

さらなる管理性の向上に向けた、ユニークな仕組みもある。それが「Dell EMC DataIQ」だ。これは様々なクラスター内にあるすべてのデータにインデックスを付与し、データの統合ビューを提供するというもの。もちろん対象となるデータには、非構造化データも含まれる。「PowerScaleなどのデル・テクノロジーズ製品だけではなく、他社製品もカバーした統合管理が可能です。これにより非構造化データをどこに保有しているのか、企業全体の状況を簡単に把握できます」(Tuseth氏)。

徹底したデータ保護で
ランサムウエアにも対抗

データ管理だけでなく、データ保護の仕組みも備え併せている。特に注目したいのは以下の2つの機能だ。

1つは「PowerScale with Superna Eyeglass Ransomware Defender」。これはクラスター内を常時チェックし、悪意のあるアクティビティパターンを見出した場合には、ユーザーロックなどで積極的にデータを保護する仕組み。インシデントが発生した場合のフォレンジック(記録媒体に保存されている各種データから不正利用の証拠を見つけ出し保全する業務)も容易になる。もう1つは「Superna AirGap Enterprise」。これは完全に外部から隔離されたネットワーク環境に専用クラスタを用意し、データをアーカイブ、いつでもそこから元のデータを復元できるというものである。

つまりPowerScaleは、あらゆる種類のデータの保存、あらゆる種類のアプリケーションのサポート、あらゆる場所での利用を、管理性の高い状態でシンプルに実現する上、保存したデータの保護も徹底できるわけだ。

このような特徴はユーザー企業にも高く評価されており、ストレージ市場の成長率の3.5倍のスピードでシェアを伸ばしている。ではなぜデル・テクノロジーズがこのようなユニークな製品を実現できたのか。その背景には同社の戦略と、その実現に向けた地道な取り組みがあるという。

「当社の基本戦略の1つは、お客様のワークロードに合わせたストレージをお客様と共につくる、というものです。そのために、メディアやエンターテイメント、ヘルスケア、半導体といった、膨大なデータを扱う必要がある複数の業界にフォーカスを当て、非構造化データのサポートを積極的に推進してきました。そのためにそれぞれの業界の経験者も採用し、お客様と直接お話しできる体制も整えています」(Tuseth氏)

その成果の1つが、今年夏に日本で行われた大規模なスポーツイベントの事例である。ここでは米国3大ネットワークの1社が撮影と配信を担当、約7000時間にのぼる4K品質の映像を、全世界に共有した。その映像データの蓄積・管理にPowerScaleが活用されたという。

また半導体業界では、欧州の半導体製造機器メーカーや、アジアの複数の半導体供給メーカーを支援し、生産性向上に貢献。ヘルスケア領域では病理プロセスのデジタル化でPowerScaleが活用されていると語る。

「これに加え、ClouderaやNVIDIAといったパートナーと共に、業界横断型の価値提供も進めています。自社だけではなくエコシステムとして、非構造化データへの取り組みを行っているのです」(Tuseth氏)

ストレージの「Software Defined化」も
積極的に推進

このPowerScaleの提供・強化に加え、デル・テクノロジーズのストレージ戦略でもう1つ注目したいものがある。それはストレージの「Software Defined化」だ。それを具現化した製品の1つが2021年10月にVMworld 2021で発表されたストレージプラットフォーム「Dell EMC ObjectScale」(以下、ObjectScale)。これはあらゆる種類のデータを扱えるオブジェクトストレージを、汎用ハードウエア上で実現できるソフトウエアだ。

「これは多くのお客様から、管理しやすいSoftware Defined型のデータ管理方法が欲しいというニーズを受け、当社が一から開発したもの。当初からDockerコンテナで展開し、現在ではKubernetesネイティブになっています。これを活用することで、ハイパフォーマンスでTCOに優れたオブジェクトストレージを利用できるようになります。もちろんパフォーマンスに関しては使用するハードウエアにも依存しますが、テスト環境でオブジェクトストレージを使いたい、というニーズには最適な選択肢になるはずです。今後はデータ分析やAI、機械学習にも利用が拡大していくでしょう」(Tuseth氏)

汎用的なハードウエア上で「Software Defined」なオブジェクトストレージを実現できる。動作環境としてはVMware vSphere with TanzuとRed Hat OpenShiftに対応。30TBまで無償で利用できる「コミュニティエディション」も提供される

その提供形態も興味深い。大きく3種類の利用形態と、2つの料金モデルが用意されているのだ。

利用形態の1つはVMware vSphere with Tanzuでの利用。この場合、ハードウエアはVxRailかVSAN Ready Nodeを使うことになる。管理をvCenterに集約できるため、VMware環境に慣れている技術者にとって、望ましい形態だといえるだろう。

その一方で、VMwareを使わないベアメタルでも利用できる。Red Hat OpenShiftにも対応しているからだ。この2つのいずれの利用形態でも、支払い方法はサブスクリプション型とELA(Enterprise License Agreement)のいずれかを選択可能となっている。

そしてもう1つの提供形態が「コミュニティエディション」。これはコミュニティによるサポートのもと、ユーザーが無償で利用できるというもの。最大30TBまでのObjectScaleを無期限で提供する。

デル・テクノロジーズでは、今後も非構造化データの蓄積・管理・活用方法を大きく変革していく考えだ。膨大で多種多様なデータを一元管理し、それをあらゆるアプリケーションや場所で利用できる。近い将来には「構造化」「非構造化」という区分すら無意味になるのかも知れない。そうした世界はもう目の前まで近づきつつあるようだ。

お問い合わせ

デル・テクノロジーズ株式会社

marketing.inquiry@dell.com