生成AIの活用に向けたインフラをオンプレミスに構築する際の勘所とは

生成AI基盤｜日立ヴァンタラ

生成AIの活用に向けたインフラを
オンプレミスに構築する際の勘所とは

生成AIの導入が企業の間で加速している。特に特定業務や専門領域に合わせた「業務特化型AI」の活用には、クラウドではなくオンプレミス環境にインフラ構築を目指すケースが増えている。しかしそこでは、LLM（大規模言語モデル）の規模に応じたGPUサーバーのサイジングに加え、最適なストレージやネットワークの選定など、総合的な知見が求められる。日立ヴァンタラでは、NVIDIAとの協力による統合ソリューション「Hitachi iQ」の提供により、そうしたニーズに応えている。（聞き手：日経BP 総合研究所エグゼクティブフェロー望月洋介）

データインフラ製品の提供を担う
事業が分社化されて新会社として設立

日立ヴァンタラ株式会社
AIインフラ事業本部
主管技師
GenAIアンバサダー
鬼塚久幸氏

望月　まずは、日立ヴァンタラのご紹介をお願いします。

鬼塚　日立製作所が従来担当してきたストレージ、サーバー、スーパーコンピューターなどのデータインフラ製品の開発、設計、製造を担うITプロダクツ事業を、経営判断の迅速化と新製品の市場投入スピードの加速を主な狙いとして、2024年4月に分社化し、設立された会社です。

　「ヴァンタラ」という言葉は聞き慣れないと思いますが、「Virtualization」と「Vantage」という言葉を混ぜ合わせた造語です。特に弊社のストレージ製品は、世界約100以上の国と地域で利用いただいており、導入実績は3万社以上にのぼります。米国のFortune 100の8割以上の企業様にお使いいただいており、海外の最先端技術をいち早く製品開発に反映しながら、クラウドやAIなどのグローバルな主要プレイヤーとの協業も推進しています。

望月　今日の生成AIインフラをめぐる課題についてお聞かせください。

鬼塚　生成AIは革新的な技術として、多くの分野で注目を集めています。急速な技術進化に伴い、生成AIの能力を最大限に引き出すためのプラットフォームの重要性が高まっています。そうした中で、実際のところ皆様は、クラウドをベースに生成AIのプラットフォームを構築されていることが多いかと思います。

　ただその一方で、業務への本格適用に向けては、特定業務や専門領域に合わせた「業務特化型AI」が求められており、そこでは外部に公開できない機密性の高いデータをクラウド上で利用することに戸惑いを感じるユーザーも少なくないというのが実情です。

「業務特化型AI」のニーズに応えて
オンプレミス環境にインフラを構築

望月　そうした状況を見据えて、日立ヴァンタラでは、どのような対応をされていますか。

鬼塚　例えば、2024年3月にNVIDIAと協力して、クラウドを使用せずに短時間で大容量のデータを学習できる生成AIインフラのためのアプライアンス型ソリューションである「Hitachi iQ」を開発しました。オンプレミスにおいて生成AIの活用を進められる環境を提供しています。これはNVIDIA DGX BasePOD認証に適合する新たなAIソリューションで、NVIDIA DGXインフラと高信頼性を有する日立のストレージ、ネットワークを組み合わせた統合的なアプライアンス製品です。複数のコンサンプションモデルにより、お客様が必要なものだけを利用できる仕組みを用意しています。

　社内には、それに基づく生成AI共通基盤を構築し、生成AIの本格的な業務活用を支援する「業務特化型LLM（大規模言語モデル）構築・運用サービス」と「生成AI業務適用サービス」を通じて、ソフトウェアエンジニアやフロントラインワーカーの働き方を革新し、生産性を向上させるための取り組みを開始させています。お客様には、実際に日立社内に作った生成AI基盤を見学いただけるようになっており、すでに大きな反響を頂戴しています。

[画像のクリックで拡大表示]

日立ヴァンタラが中心となって構築した、日立生成AI共通基盤の概要

システム全体のサイジングから、具体期なインフラの構築方法、運用方法に至るまでの総合的な領域にかかわる日立ヴァンタラのノウハウを駆使したものとなっている

GPUサーバーの最適なサイジングから
ネットワーク、ストレージの選定を支援

望月　Hitachi iQを利用した生成AIインフラの構築をめぐり、お客様から実際に寄せられる質問として多いのは、どのようなものでしょうか。

鬼塚　まずあげられるのが、サーバーリソースのサイジングにかかわる疑問です。LLMで推論を行う際に、具体的にどれくらいのGPUメモリと計算能力が必要かということです。もちろんそれは、LLMの規模によっても変わってきますが、仮にパラメータ数が70ビリオン程度の規模であれば、だいたい140ギガバイトくらいのGPUメモリが必要になってくるものと試算されます。ここで80ギガバイトを搭載するNVIDIAのH100のGPUを使う場合、2基のGPUが必要になってくる計算です。

　そうしたGPUリソースの適用によるパフォーマンスの最適化に加え、複数のGPUが協調して動作するには、高速なネットワークが必要だったり、大量のデータを効率的に処理するためのストレージリソースも必要です。つまり、生成AI基盤の構築を成功裏に進めるには、GPUサーバーのサイジングにとどまらず、それらをつなぐ高速なネットワーク、あるいはオブジェクトストレージ、分散ファイルシステムなどの用途に最適なストレージの選択がカギとなり、なかなか一筋縄ではいかないというのが実情なのです。

望月　そうした観点から捉えたとき、オンプレミス環境での生成AIインフラの構築に向けては、すでに紹介いただいたような技術的、運用的な課題を解決する、システム全体を見据えたサイジングや、具体的なインフラ構築方法、運用方法に至る総合的な知見が必要になってくるわけですね。

鬼塚　そういうことになります。言い換えれば、Hitachi iQを基盤とした統合ソリューションは、代表的な技術的および運用上の課題の解消を、インフラの観点から支援するものです。同ソリューションでは、お客様の要件に合わせて、大規模学習向けのエンタープライズ、推論・学習向けのミッドレンジ、さらには推論向けのエントリーに至る各クラスでの提供が可能で、お客様はそのニーズに応じて、必要なライナップを適宜選択いただくことができます。

望月　オンプレミス環境での生成AIインフラの構築を目指される企業の方々には、まずは実際に日立ヴァンタラが中心となって実現した日立生成AI共通基盤の見学を通して、その実力のほどを、身を以て体験いただくことが、強く推奨されますね。

※講演の一部をOn-Demand形式で視聴いただけます。

日立ヴァンタラ

https://www.hitachivantara.com/

INDEXページ