2024年9月3日に開催されたイベント「Intel Connection Japan 2024」にエフサステクノロジーズの菅野正行氏が登壇し、「AI=GPUだけではない!? インテル® AMXで実現するAIインフラ最適解」と題する講演を行った。AI(人工知能)のインフラに2つの大きな課題が生じている。「PRIMERGY CDI」と「インテル® AMX」の連携により、解決の最適解が期待できる。注目を集めた講演の内容をレポートする。
AIのインフラで起きている
2つの課題とは
「AIの活用が加速するにつれ、インフラに2つの課題が生じている」と、菅野氏は冒頭で述べた。その課題の1つは、インフラへの要求が多様なこと。「学習」と「推論」、「開発」と「運用」のような目的の違いや、「画像認識」と「言語生成」のようなデータモデルの違いにより、必要なハードウェア構成が変わってくる。もう1つは、顧客の業務も変化するため、一度構築したインフラを最適化させていく必要があることだ。「設備投資と運用コストを踏まえ、適切な計算リソースを素早く整備することが課題になっています」と続ける。
その解決策として生まれた新技術が、「PRIMERGY CDI」だ。CDIとは「Composable Disaggregated Infrastructure」を意味する。最大の特長は、要件の変化に応じてサーバー構成を自在に変更できることだ。
GPUのリソースを自在に割り当てられる「PRIMERGY CDI」の特長
高速な演算に必要なGPU(グラフィックス・プロセシング・ユニット)を、全てのサーバーが共有できるリソースとして「リソースプール」で管理し、必要な時に必要なサーバーに必要な量だけ割り当てて使えるようにする。学習処理をしたい時は、全てのGPUを1台のサーバーに集中的に割り当て、推論処理をしたい時は、GPUを分けて複数のサーバーに割り当てる。使わない時は、電源をオフにして消費電力を抑える。「CDIは、AIインフラの課題を解決する立役者になります」と菅野氏は述べた。
PRIMERGY CDIと
インテル® AMXで最適解を得る
PRIMERGY CDIと「インテル® AMX」を組み合わせることで、効果はさらに高まる。「第4世代インテル® Xeon® スケーラブル・プロセッサーとインテル® AMXの性能が実用的であることがわかりました。うまく活用すれば、インフラのリソースを最大限に活かすことができます」(菅野氏)。
実際に、インテル® AMXを使用して性能を評価してみた。第4世代インテル® Xeon® スケーラブル・プロセッサーとインテル® AMXを組み合わせた場合、ハイパフォーマンスのGPUを凌ぐほどではないが、推論用途であれば十分に使える高い性能を確認できた。
インテル® AMXを使った性能評価比較。数字が低い方が性能が高い
例えば、昼間は推論処理が中心で、夜間は学習処理が中心になるようなケースだ。昼間は推論用の複数のサーバーにGPUを割り当て、夜間は全GPUを学習用のサーバーに集中させる。夜間に必要な推論処理には、インテル® AMXを使う。
AIのワークロードにより、インフラに対する要件は変化する。ハイパフォーマンスのGPUを多数そろえようとすれば、過剰投資につながる可能性がある。「全ての処理をGPUで処理する必要はありません。インテル® AMXで処理できるものとGPUで処理すべきものを適材適所で使い分ければ、高い能力を維持したまま総保有コストを削減できます」と菅野氏は話した。
PRIMERGY CDIとインテル® AMXを組み合わせた場合の3つの価値
PRIMERGY CDIとインテル® AMXが生み出す価値は3つある。「計算リソース数の最適化」は導入コストの削減、「消費電力の抑制」は運用コスト低減、「インフラ選択肢の増加」はAI業務の拡大に効く。
「機能や性能だけでなく、価格や調達性を含めたビジネスの最適解を検討できます」と述べ、菅野氏は講演をまとめた。


最新技術や製品情報など様々な記事を公開予定!















