「Intel Connection Japan 2024」 event report　AIインフラの2大課題を解決する最適解はどこにある？

2024年9月3日に開催されたイベント「Intel Connection Japan 2024」にエフサステクノロジーズの菅野正行氏が登壇し、「AI＝GPUだけではない!? インテル^® AMXで実現するAIインフラ最適解」と題する講演を行った。AI（人工知能）のインフラに2つの大きな課題が生じている。「PRIMERGY CDI」と「インテル^® AMX」の連携により、解決の最適解が期待できる。注目を集めた講演の内容をレポートする。

AIのインフラで起きている
2つの課題とは

「AIの活用が加速するにつれ、インフラに2つの課題が生じている」と、菅野氏は冒頭で述べた。その課題の1つは、インフラへの要求が多様なこと。「学習」と「推論」、「開発」と「運用」のような目的の違いや、「画像認識」と「言語生成」のようなデータモデルの違いにより、必要なハードウェア構成が変わってくる。もう1つは、顧客の業務も変化するため、一度構築したインフラを最適化させていく必要があることだ。「設備投資と運用コストを踏まえ、適切な計算リソースを素早く整備することが課題になっています」と続ける。

その解決策として生まれた新技術が、「PRIMERGY CDI」だ。CDIとは「Composable Disaggregated Infrastructure」を意味する。最大の特長は、要件の変化に応じてサーバー構成を自在に変更できることだ。

GPUのリソースを自在に割り当てられる「PRIMERGY CDI」の特長

高速な演算に必要なGPU（グラフィックス・プロセシング・ユニット）を、全てのサーバーが共有できるリソースとして「リソースプール」で管理し、必要な時に必要なサーバーに必要な量だけ割り当てて使えるようにする。学習処理をしたい時は、全てのGPUを1台のサーバーに集中的に割り当て、推論処理をしたい時は、GPUを分けて複数のサーバーに割り当てる。使わない時は、電源をオフにして消費電力を抑える。「CDIは、AIインフラの課題を解決する立役者になります」と菅野氏は述べた。

PRIMERGY CDIと
インテル^® AMXで最適解を得る

PRIMERGY CDIと「インテル^® AMX」を組み合わせることで、効果はさらに高まる。「第4世代インテル^® Xeon^® スケーラブル・プロセッサーとインテル^® AMXの性能が実用的であることがわかりました。うまく活用すれば、インフラのリソースを最大限に活かすことができます」（菅野氏）。

実際に、インテル^® AMXを使用して性能を評価してみた。第4世代インテル^® Xeon^® スケーラブル・プロセッサーとインテル^® AMXを組み合わせた場合、ハイパフォーマンスのGPUを凌ぐほどではないが、推論用途であれば十分に使える高い性能を確認できた。

インテル^® AMXを使った性能評価比較。数字が低い方が性能が高い

例えば、昼間は推論処理が中心で、夜間は学習処理が中心になるようなケースだ。昼間は推論用の複数のサーバーにGPUを割り当て、夜間は全GPUを学習用のサーバーに集中させる。夜間に必要な推論処理には、インテル^® AMXを使う。

AIのワークロードにより、インフラに対する要件は変化する。ハイパフォーマンスのGPUを多数そろえようとすれば、過剰投資につながる可能性がある。「全ての処理をGPUで処理する必要はありません。インテル^® AMXで処理できるものとGPUで処理すべきものを適材適所で使い分ければ、高い能力を維持したまま総保有コストを削減できます」と菅野氏は話した。

PRIMERGY CDIとインテル^® AMXを組み合わせた場合の3つの価値

PRIMERGY CDIとインテル^® AMXが生み出す価値は3つある。「計算リソース数の最適化」は導入コストの削減、「消費電力の抑制」は運用コスト低減、「インフラ選択肢の増加」はAI業務の拡大に効く。

「機能や性能だけでなく、価格や調達性を含めたビジネスの最適解を検討できます」と述べ、菅野氏は講演をまとめた。

お問い合わせ

エフサステクノロジーズ株式会社

公式HPはこちら

インテル株式会社

公式HPはこちら

AIのインフラで起きている2つの課題とは

PRIMERGY CDIとインテル® AMXで最適解を得る

AIのインフラで起きている
2つの課題とは

PRIMERGY CDIと
インテル^® AMXで最適解を得る