対話型AIシステムを
オンプレミスで実現
そこで着目したいのが、オンプレミスで使える生成AIインフラだ。自社内に閉じた環境であれば、前述のようなデータも安心して活用することができる。同社でも、こうしたニーズに向けて、オンプレミス環境向け対話型生成AIソリューション「Private AI Platform on PRIMERGY」を提供している(図1)。
図1 オンプレミス環境での生成AI活用を実現
AI基盤サービスとGPUサーバーを一体で提供する「Private AI Platform on PRIMERGY」。オンプレミスに閉じた環境内で、安全かつ効率的に生成AIシステムの開発・運用が行える
「Private AI Platform on PRIMERGYは、機密データを社外に出さずに対話型生成AIを活用したいというニーズに応えるソリューションです。GPU搭載PCサーバー上に、『検証済OS/コンテナ基盤』、『Large Language Model(以下、LLM):大規模言語モデル』、『Retrieval-Augmented Generation(以下、RAG):検索拡張生成』、『OpenAI互換API/Web GUI』などを組み込んだ対話型AI基盤を製造工場にて構築した上で提供しています。短期間での導入が可能なほか、インターネット接続不要の完全オンプレミス運用が行えます」と中嶋氏は説明する。
さらに注目したいのが、用途や活用段階に応じて選べる4つのモデルが用意されている点だ。少人数での利用やトライアル利用なら「Very Small」、社内でのスモールスタートには「Small」、より高精度で中規模クラスなら「Medium」、本格的な大規模利用では「Large」と、生成AI活用を段階的にステップアップさせていけるのである。
「特にLargeモデルにおいては、Supermicro社との協業強化・拡大により、大規模生成AI・データ分析向けの最新プラットフォームを迅速に提供していきます。その一環として、今回提供を開始したのが、最新世代GPUである『NVIDIA製 B200 GPU』を8基搭載したハイエンドGPUサーバー『PRIMERGY GX2570 M8s』です」と中嶋氏は話す。
この製品では、10Uラックマウント型空冷モデルと4Uラックマウント型水冷モデルの2種類を用意。さらに、最短2時間の駆け付け対応を実現した保守サービス「Support Desk」やサーバー管理機構、クラウド利用と同様の支払いを可能にするサブスクリプションサービス、前述のPrivate AI Platform on PRIMERGYによる課題解決など、エフサステクノロジーズならではの付加価値も提供されている。
AI活用において重要となるのは、サーバーだけではない。ストレージについてもいくつかの要件が求められる。AI学習やRAGでは大量のデータを利用する上に、テキストや画像、動画などのデータを高速に処理する必要があるからだ。また、将来的な容量増加に対応できるスケーラビリティや、データ漏えいなどを防ぐためのセキュリティー機能も欠かせない。そこで同社では、これらの要素を兼ね備えた製品として「ETERNUS AX/AC/HX series」を提供している。
「高い可用性と強力なセキュリティー機能がETERNUS AX/AC/HX seriesの大きな強みとなっています。まず高可用性では、データミラーリング、レプリケーション、スナップショットなどの機能により、継続的なデータアクセスを確保。自動化された障害回復機能も装備していますので、ダウンタイムも最小化できます」と中嶋氏は話す。
また、セキュリティー機能では、データ暗号化、アクセス制御、バックアップなどの機能でデータ漏えいを防止。データ匿名化などのプライバシー保護機能や、モデル改ざんなどを検知する監査機能も備わっている。
「当社では『地球上で最も安全なストレージの実現』を目指しており、深刻な社会問題ともなっているランサムウエアについても『自律型ランサムウエア対策機能』を用意しています。万が一、専用AIが異常な振る舞いを検出した場合には、スナップショットの作成と管理者へのアラート通知を自動的に実行。予防、復旧に役立つ機能も実装しているので、一連のランサムウエア対策をストレージ内で完結できます」と中嶋氏は話す。
なお、ETERNUS AX/AC seriesは多機能型オールフラッシュモデル、ETERNUS HX seriesは多機能型ハイブリッドモデルとなっているが、そのほかにシンプル型オールフラッシュモデルの「ETERNUS AB series」、シンプル型ハイブリッドモデルの「ETERNUS HB series」もラインアップされている。