- 生成AI基盤|日立ヴァンタラ
生成AIの活用に向けたインフラを
オンプレミスに構築する際の勘所とは
生成AIの導入が企業の間で加速している。特に特定業務や専門領域に合わせた「業務特化型AI」の活用には、クラウドではなくオンプレミス環境にインフラ構築を目指すケースが増えている。しかしそこでは、LLM(大規模言語モデル)の規模に応じたGPUサーバーのサイジングに加え、最適なストレージやネットワークの選定など、総合的な知見が求められる。日立ヴァンタラでは、NVIDIAとの協力による統合ソリューション「Hitachi iQ」の提供により、そうしたニーズに応えている。(聞き手:日経BP 総合研究所 エグゼクティブフェロー 望月 洋介)
データインフラ製品の提供を担う
事業が分社化されて新会社として設立
AIインフラ事業本部
主管技師
GenAIアンバサダー
鬼塚 久幸 氏
望月 まずは、日立ヴァンタラのご紹介をお願いします。
鬼塚 日立製作所が従来担当してきたストレージ、サーバー、スーパーコンピューターなどのデータインフラ製品の開発、設計、製造を担うITプロダクツ事業を、経営判断の迅速化と新製品の市場投入スピードの加速を主な狙いとして、2024年4月に分社化し、設立された会社です。
「ヴァンタラ」という言葉は聞き慣れないと思いますが、「Virtualization」と「Vantage」という言葉を混ぜ合わせた造語です。特に弊社のストレージ製品は、世界約100以上の国と地域で利用いただいており、導入実績は3万社以上にのぼります。米国のFortune 100の8割以上の企業様にお使いいただいており、海外の最先端技術をいち早く製品開発に反映しながら、クラウドやAIなどのグローバルな主要プレイヤーとの協業も推進しています。
望月 今日の生成AIインフラをめぐる課題についてお聞かせください。
鬼塚 生成AIは革新的な技術として、多くの分野で注目を集めています。急速な技術進化に伴い、生成AIの能力を最大限に引き出すためのプラットフォームの重要性が高まっています。そうした中で、実際のところ皆様は、クラウドをベースに生成AIのプラットフォームを構築されていることが多いかと思います。
ただその一方で、業務への本格適用に向けては、特定業務や専門領域に合わせた「業務特化型AI」が求められており、そこでは外部に公開できない機密性の高いデータをクラウド上で利用することに戸惑いを感じるユーザーも少なくないというのが実情です。
「業務特化型AI」のニーズに応えて
オンプレミス環境にインフラを構築
望月 そうした状況を見据えて、日立ヴァンタラでは、どのような対応をされていますか。
鬼塚 例えば、2024年3月にNVIDIAと協力して、クラウドを使用せずに短時間で大容量のデータを学習できる生成AIインフラのためのアプライアンス型ソリューションである「Hitachi iQ」を開発しました。オンプレミスにおいて生成AIの活用を進められる環境を提供しています。これはNVIDIA DGX BasePOD認証に適合する新たなAIソリューションで、NVIDIA DGXインフラと高信頼性を有する日立のストレージ、ネットワークを組み合わせた統合的なアプライアンス製品です。複数のコンサンプションモデルにより、お客様が必要なものだけを利用できる仕組みを用意しています。
社内には、それに基づく生成AI共通基盤を構築し、生成AIの本格的な業務活用を支援する「業務特化型LLM(大規模言語モデル)構築・運用サービス」と「生成AI業務適用サービス」を通じて、ソフトウェアエンジニアやフロントラインワーカーの働き方を革新し、生産性を向上させるための取り組みを開始させています。お客様には、実際に日立社内に作った生成AI基盤を見学いただけるようになっており、すでに大きな反響を頂戴しています。
GPUサーバーの最適なサイジングから
ネットワーク、ストレージの選定を支援
望月 Hitachi iQを利用した生成AIインフラの構築をめぐり、お客様から実際に寄せられる質問として多いのは、どのようなものでしょうか。
鬼塚 まずあげられるのが、サーバーリソースのサイジングにかかわる疑問です。LLMで推論を行う際に、具体的にどれくらいのGPUメモリと計算能力が必要かということです。もちろんそれは、LLMの規模によっても変わってきますが、仮にパラメータ数が70ビリオン程度の規模であれば、だいたい140ギガバイトくらいのGPUメモリが必要になってくるものと試算されます。ここで80ギガバイトを搭載するNVIDIAのH100のGPUを使う場合、2基のGPUが必要になってくる計算です。
そうしたGPUリソースの適用によるパフォーマンスの最適化に加え、複数のGPUが協調して動作するには、高速なネットワークが必要だったり、大量のデータを効率的に処理するためのストレージリソースも必要です。つまり、生成AI基盤の構築を成功裏に進めるには、GPUサーバーのサイジングにとどまらず、それらをつなぐ高速なネットワーク、あるいはオブジェクトストレージ、分散ファイルシステムなどの用途に最適なストレージの選択がカギとなり、なかなか一筋縄ではいかないというのが実情なのです。
望月 そうした観点から捉えたとき、オンプレミス環境での生成AIインフラの構築に向けては、すでに紹介いただいたような技術的、運用的な課題を解決する、システム全体を見据えたサイジングや、具体的なインフラ構築方法、運用方法に至る総合的な知見が必要になってくるわけですね。
鬼塚 そういうことになります。言い換えれば、Hitachi iQを基盤とした統合ソリューションは、代表的な技術的および運用上の課題の解消を、インフラの観点から支援するものです。同ソリューションでは、お客様の要件に合わせて、大規模学習向けのエンタープライズ、推論・学習向けのミッドレンジ、さらには推論向けのエントリーに至る各クラスでの提供が可能で、お客様はそのニーズに応じて、必要なライナップを適宜選択いただくことができます。
望月 オンプレミス環境での生成AIインフラの構築を目指される企業の方々には、まずは実際に日立ヴァンタラが中心となって実現した日立生成AI共通基盤の見学を通して、その実力のほどを、身を以て体験いただくことが、強く推奨されますね。

