企業のITインフラでは、クラウドとオンプレミスを組み合わせたハイブリッド運用が主流となってきた。セキュリティ、コスト、パフォーマンスの観点からオンプレミス回帰が進む。オンプレミスの目指すべき姿では、1.簡単・シンプル・省力化の実現、2.生成AI活用を加速するプラットフォームの2点が重要なポイントとなる。情報システム部門の課題解決へつながる次の一手を、エフサステクノロジーズが提示した。

オンプレミスにおける簡単・シンプル・省力化の実現

エフサステクノロジーズ株式会社
プロダクトソリューション事業本部
DC-AIインフラインテグレーション統括部
シニアディレクター
中嶋 一雄 氏

「これからのオンプレミスが目指すべき姿では、2つの視点が重要になります」と、エフサステクノロジーズ プロダクトソリューション事業本部 DC-AIインフラインテグレーション統括部 シニアディレクター 中嶋一雄氏は講演の冒頭で指摘した。

エフサステクノロジーズ株式会社
プロダクトソリューション事業本部
DC-AIインフラインテグレーション統括部
シニアディレクター
中嶋 一雄 氏

1点目は、IT人材不足が深刻化する中、オンプレミスにおける導入、運用、保守の省力化。2点目は、AI活用を加速するプラットフォームとしての役割。GPUの有効活用による投資抑制と、オンプレミスで生成AIを活用したいというニーズへの対応が求められる。

1点目の導入、運用、保守の省力化では、HCI(ハイパーコンパージドインフラ)が有力な解決策となる。選択のポイントは、パフォーマンスはもとより品質やサポートも重視すべき要素だ。「エフサステクノロジーズが提供するHCIは、ユーザーの多様な消費電力、パフォーマンス、効率性の要件に応えるインテルのCPU(インテル® Xeon® プロセッサー)を搭載したPCサーバPRIMERGY上に、VMware、Nutanixから最適なHCI構成を選ぶことができます。PRIMERGYは部品調達から組立まで、国内で厳格に管理し製造しているメイドインジャパン品質が特長です。さらに、全国に充実したサポート拠点を有しており、トラブル時も業界最高水準の2時間以内のオンサイト修理でお客様の業務継続を支えます」(中嶋氏)

※:サーバをStandard契約した場合の目標値。対応時間はご契約内容により異なります。

オンプレミスでAIを活用したいニーズに対応

2点目のAI活用を加速するプラットフォームでは、IT投資の抑制が重要な課題となる。高額なGPUをいかに効率的に活用していくか。「エフサステクノロジーズはPRIMERGY CDI(Composable Disaggregated Infrastructure)を提供し、GPUの有効活用を実現します」と中嶋氏は話し、説明を加えた。

「CDIは、GPU等のデバイスリソースを共有プール化する技術です。ワークロードやデバイスリソースの状態に応じてインフラを自動構築します。たとえば、AI学習用途に複数GPUを集中的に割り当てて、また推論用途では各サーバに分散してGPUを割り当てるといったことが、設定変更のみで実施できます。また、GPUは電力消費量が高いことから、不使用時に電源オフにする省電力機能もサポート予定です」

PRIMERGY CDIにより、AI向けの高価なGPUを共有リソースとして利用可能にしたうえで、これを「インテル® Advanced Matrix Extensions(インテル® AMX)」と組み合わせて効果的に運用する。インテル® AMXとは、「インテル® Xeon® スケーラブル・プロセッサー・ファミリー」に搭載された内蔵型のアクセラレーターだ。GPUを使わず、CPUだけでAIの処理能力を高速化し、実用的なAIシステムの構築も可能になる。

中嶋氏は、PRIMERGY CDIの利用例を紹介し効果に言及した。「昼間にGPU6基を使うシステムA(AIサービス)と、夜間にGPU6基を使うシステムB(AIモデルR&D)を別々に稼働させている場合に、CDI技術を活用してGPU6基をプ―ル化し、自動リソース切替によって共有利用できます。当社の試算では、CAPEX(設備投資)30%、消費電力19%の削減効果が見込めます」

CDI技術によりGPUをプ―ル化することで、GPUの有効活用が可能となり、TCO削減に貢献する

日本企業に最適な生成AIプラットフォーム

機密情報を安心・安全に扱えるオンプレミスにおいて、生成AI活用のニーズが高まっている。生成AI活用は、企業が先を争って取り組んでいる領域だ。基盤導入ではスピード感と使いやすさが重要なポイントとなる。「オンプレミス環境向け対話型AIソリューション『Private AI Platform on PRIMERGY』は、日本企業に最適な生成AIプラットフォームです」と中嶋氏は話し、説明する。

「GPU搭載PRIMERGYをベースに、対話型生成AIが動作する検証済みハードウェアソリューションとして構成しています。コストパフォーマンスにも優れた、すぐに使える構築済みReadyモデルとしてお届けします。また、日本語による業務利用に適したLLM(大規模言語モデル)を選定して提供します。RAG(検索拡張機能)を用いて社内データを活用した回答の生成も可能です。さらに、インターネット接続する必要がなく、オンプレミス環境のみで完結できるためセキュリティを確保できます。

検証済みハードウェア構成、日本語精度が高い学習済みモデルにより、対話型生成AIをすぐに利用できる

導入企業はインテルのCPU(インテル® Xeon® プロセッサー)を搭載した「Private AI Platform on PRIMERGY」を設置し、ネットワークにつないで電源を入れるだけ。Chatbotが使える基盤が自動的に立ち上がる。RAGを利用し社内データを生成AIに読み込ませることで、自社専用Chatbotとして様々な用途で活用できる。生成AIの活用では、ハルシネーション対策も必要だ。「生成AIは、事実とは異なる情報をつくりだしてしまう可能性があります。RAGを利用した場合は生成AIがどこの情報を参照し回答したかを確認できる機能を備えています」と中嶋氏は話す。

すでに多くの企業から引き合いや問い合わせが寄せられている。「ヘルスケア領域では、院内情報を踏まえた各種資料の作成/要約用途でご検討いただいています。公共領域では、来訪者の対応履歴作成などへの活用もご検討中です。また当社の社内実践では、過去の対応履歴、マニュアル、設計書などをインプットし、製品に関するお問い合せに対し生成AIが適切に回答することで、サポート業務の効率化に役立てています」

規模や用途に応じてラインナップも豊富だ。圧倒的な省スペースでオフィスや工場等に最適なVery Smallモデルから、社内での生成AI活用に適したSmallモデル、高い精度を求める生成AI用途向きのMediumモデル、高可用性、実践的な学習用途に応えるLargeモデルまで、企業の生成AI戦略に合わせた選択が可能だ。

中嶋氏は「お客様のITインフラの次の一手、企業の成長に貢献する守りと攻めを両立するオンプレミスの実現に向け全力でサポートします」と講演を締めくくった。

関連リンク

お問い合わせはこちら
概要と価値ポイントを紹介 サービス型商材でインフラ関連業務を改革! NEC 電力効率向上、排熱対策、AIによる運用支援を紹介 最新世代 Dell PowerEdgeサーバーでできるようになること デル・テクノロジーズ株式会社 DX時代のインフラ構築を支えるサーバー向けCPU最新情報 インテル株式会社