ビジネス現場で生成AIの活用が急速に進展している。ただ「ChatGPTを使ってみた」というレベルでは、まだ最初の一歩を踏み出したにすぎない。企業・組織内には膨大なビジネスデータが存在する。これをAIで活用して初めて、業務改革や製品開発の助けになるアウトプットが得られるだろう。そこまで進んでいるケースは、まだ決して多くない。
この段階に到達するために不可欠なのが、AI時代に即した高品質なデータ基盤だ。これを支えるインフラの条件について、ピュア・ストレージ・ジャパンの正見 卓司氏は次のように話す。
「AIの価値を最大化するためには、大きく次の3つの要件を満たす必要があります。1つ目は、将来的な要件までをきちんと考慮しておくこと。現在の利用用途に焦点を合わせるだけでは不十分であり、ニーズの変化や用途の多様化、AIワークロードの増大までを考えた、柔軟でスケーラブルなインフラを整えることが肝心です」
2つ目は、AIデータ・パイプラインの全段階を高速化することだ。ChatGPTなどのLLM(大規模言語モデル)の裏側では、回答精度を高めるためのデータの学習が常に行われている。これは組織内のデータを使う場合も同様だ。学習をいかに高速化・効率化できるかが、早期の効果創出に向けたカギを握る。
そして3つ目がセキュリティーである。組織内のデータには当然、機密情報も含まれる。これらをAIで活用するためには、基盤が十分な安全性を備えていることが前提になるだろう。
「データ基盤の中核を担うのがストレージですが、現行のストレージソリューションのほとんどが、AI時代に対応できないと当社は考えています。例えば、非構造化データの量は、数年後までに現在の10倍になるといわれています。この量のデータを格納することさえ不可能なものが多いのです」と正見氏。ピュア・ストレージは、この状況に対し、解決策を提示するという。
同社のオールフラッシュストレージ製品は、1本につき150TBの容量を提供することが可能だ。3Uのラックであればこれを20本格納できるため、それだけで数ペタバイトの容量を確保できる。「これにより、AI学習に必須になる大量のデータを簡単に扱えるようになるでしょう。オールフラッシュ製品のため、パフォーマンスも非常に高いです」と正見氏は紹介する。
また、データが組織内に散らばっているため思うように活用できないという課題を抱える企業・組織は少なくない。そのようなデータのサイロ化の問題も、同社のストレージソリューションを使うことで解決できるという。
具体的に、ピュア・ストレージは「FlashBlade」というオールフラッシュデータハブを提供している。このハブを介することで、バックアップやストリーミング分析、データレイク、DWHなどの用途ごとに最適化されているストレージ製品を、1つのストレージ環境として扱えるようになる(図1)。この仕組みを備えたストレージ基盤があれば、社内のデータを容易に集約でき、AI活用も一層加速することができるだろう。
図1 オールフラッシュデータハブ「FlashBlade」
バックアップ、データレイク/DWH、データ分析、AI活用など、用途ごとに個別最適化された既存のストレージ製品を、1つのストレージ環境として扱うことができる
「また、ストレージ製品は年を経るごとにパフォーマンスが低下するため、数年ごとにリプレースする必要があります。そのため、ハードウエアの入れ替えやデータ移行にコストと手間がかかりますが、この問題を解決するために当社は『Evergreen Storage』を用意しています」(正見氏)。これは、ストレージを停止することなく、同一/上位互換製品へ入れ替えられるサービスだ。導入時に提供されていた機能だけではなく、新たに拡張された機能も、定額の保守費用を支払うだけで利用できる。その名の通り「永久に古くならない」ストレージ環境を実現できるのである。
「AI活用は、長い期間をかけて継続的に高度化させていく必要があります。Evergreen Storageであれば、その間もデータ移行などに煩わされることなく、コストを抑えて使い続けられます。オンプレミスはもちろん、as-a-service型で利用いただくことも可能です」と正見氏は語る。
さらにピュア・ストレージの製品は、高度なセキュリティー機能も有している。代表的なのがランサムウエア対策だ。
IPAの「情報セキュリティ10大脅威」でも2021年から4年連続1位になっているランサムウエア。国内での被害件数も多い。データが暗号化または破壊されて利用できなくなれば、AI活用は立ち行かなくなる。そのため、対策としてデータバックアップの見直しを検討している企業は多いだろう。
「バックアップは取れていても、被害直前の水準まで復旧できたケースは少ないのが実情です。仮に復元できても、そのために多くのコストと時間が必要になり、大きな影響を受けてしまうケースは多いです」と正見氏は指摘する。ランサムウエアによるデータ暗号化を100%防ぐことは難しい。たとえ暗号化されても迅速かつ正確に復旧できる体制を整えておくことが、ビジネスのレジリエンスを高めるためのポイントになるだろう。
データ復旧機能として広く使われているのがスナップショットだ。しかし、管理者権限が窃取されると、スナップショット自体も変更・削除されてしまう可能性がある。そこでピュア・ストレージは、「SafeModeスナップショット機能」を提供している。
管理者でも変更・削除できない領域にスナップショットを保存し、被害にあった際にはそこからデータを復旧する。先に紹介したFlashBladeと併用すれば、最大400日にわたってデータの保持が可能だ。長期間潜伏することが多いランサムウエアからも、データを守りきることができるだろう。ピュア・ストレージのランサムウエア対策を利用することで、大きな追加投資を行うことなくデータ復旧の確度を高められる。
加えて、ピュア・ストレージはAIを活用した顧客支援の仕組みも有している。一例が、プレディクティブサポートの仕組みである「Pure1」だ(図2)。利用ログなどの情報をAIが収集・解析し、障害や問題の予兆を検知した場合には自動的に顧客にアラートを上げる。「さらに、ストレージ環境の状態確認や問題の対処を対話形式で行える『AIコパイロット』も提供を開始しています。より効率的かつ柔軟な運用が可能になるでしょう」と正見氏は言う。
図2 AIを活用したプレディクティブサポート「Pure1」
膨大なログデータなどをAIが解析することで、障害や問題の予兆を検知してプロアクティブに顧客に通知する。問題発生を未然に防いだり、対処を迅速化したりすることが可能になるだろう
AIの効果を引き出す上で、組織内のデータをどのように扱うかは重要なテーマとなる。ピュア・ストレージのソリューション群は、AI時代に最適なデータ基盤を構築するための大きな助けになるだろう。