生成AIを支えるITインフラとして、「GPU一択でいいのか?」という懸念を聞く機会が増えてきた。生成AI活用が進むのに伴い、供給面はもとより用途、コストなど多様なニーズへの対応が求められる。新たな選択肢として注目を集めているのが、「インテル® Gaudi® 3 AIアクセラレーター」(以下、Gaudi® 3)だ。2024年末からGaudi® 3搭載サーバーが続々リリースされる。さらに、インテルが開発に携わった生成AIプラットフォームArticul8、AIソリューション基盤IBM CloudへのGaudi® 3採用など大きな動きも出てきた。企業、市場からGaudi® 3への期待が一気に高まってきている。
GPUと比較してパフォーマンスに遜色なし
価格性能比、電力効率で選ぶならGaudi® 3
生成AIの活用シーンが急速に拡大している。生産性向上、人手不足解消、コスト削減、働き方改革推進、新規事業創出など、様々な経営課題を解決に導く力となるからだ。重要性や必要性が高まるほどに、克服すべき2つのテーマに直面する。
1つ目は、GPU一択で多様なニーズや、加速する生成AIの活用ニーズに対応できるのか。安定供給の観点でも新たな選択肢が必要だ。2つ目は、性能を維持しつつ、価格や消費電力をいかに抑制するか。投資対効果はもとよりカーボンニュートラルの観点も重要なポイントとなる。
2つのテーマの解決策として有望視されているのが、Gaudi® 3だ。システム開発パートナーとして名を連ねる主要メーカーに対し、企業から多くの問い合わせが寄せられている。大きな期待の裏付けとなっているのが、パフォーマンスと価格性能比だ。
パフォーマンスでも、Gaudi® 3はNVIDIA H100を上回る。広く利用されている大規模言語モデルを実行し、平均推定パフォーマンスを比較(インテル調べ)。その結果、Gaudi® 3は1.5倍高速の学習処理、1.5倍高速の推論処理を発揮した。FP8(8ビット浮動小数点フォーマット)とBF16(16ビット浮動小数点フォーマット)の1.8Pflops、128GBの広帯域幅メモリー(HBM2eメモリー)容量などにより卓越したパフォーマンスを実現。また行列演算処理に特化したMME(行列乗算エンジン)が8個実装され、6万4000もの並列処理を実行する能力も備える。
限りある予算の中で、いかに生成AIの効果を最大化していくか。鍵を握るのが価格性能比だ。Gaudi® 3は、NVIDIA H100と比べ1.4倍の電力効率で推論を実行できる(インテル調べ)。プロセスノードをGaudi® 2の7nmから5nmに微細化し、面密度と電力効率の向上を図った。電気料金が高騰する中、電力コストの削減につながる。さらに、Gaudi® 3はオンチップのEthernetを内蔵し、大規模なクラスタを構成した場合も別途NICを用意する必要がない。様々なベンダーのスイッチを使用できるため、企業の要望やニーズに合わせた柔軟な構成が可能だ。
Gaudi® 3は、学習処理、推論処理、電力効率で競合製品を上回る
生成AIの活用において、開発者やユーザーの視点に立つと、様々なソフトウェアをスムーズに使えることは必要条件となる。インテル® Gaudi®ソフトウェア・スイートは、Gaudi® 3上で学習処理や推論を円滑に実行するために用意されたものだ。機械学習ライブラリPyTorch、高速化ライブラリDeepSpeed、オーケストレーションOpenShiftなど代表的なAIエコシステムをサポート。また、インテル® Gaudi®ソフトウェア・スイートにより数行のコード追加でNVIDIAからモデルを移植し、Gaudi® 3で動かすことが可能だ。新規開発はもとよりGaudi® 3を用いたAI開発環境への移行も容易に行える。
2024年末にはSuper Micro Computer(スーパー・マイクロ・コンピューター)、Dell、HPEなどからGaudi® 3搭載サーバーが続々リリースされる。GPUに代わる新しい選択肢として、生成AIの未来を拓くGaudi® 3への期待が高まっている。
Gaudi® 3を搭載するSuper Micro Computerのサーバー
「生成AIプラットフォームArticul8 + Gaudi® 3」
生成AI活用でネックとなるセキュリティ課題を解決
AIアクセラレーターとAIアプリケーションの組み合わせによって効果は最大化する。生成AIアプリケーションの構築・展開において新たな選択肢となるのが、生成AIプラットフォーム「Articul8」だ。Articul8は、インテルから生まれた新しいベンチャー企業。インテルのデータセンター、Gaudi® 、オープンソースなどを組み合わせ、2年の時間をかけて開発。生成AI活用のボトルネックとなる課題解決が狙いだ。
Articul8 AI
Head of Strategic Partnerships
Craig T. Doeden氏
生成AI活用では、セキュリティの懸念を払拭することが求められる。問題は、生成AIで活用するデータの保護だ。「生成AIの活用におけるデータ活用には段階があります」と、Articul8 の Craig T. Doeden氏は話し、こう続ける。「第一段階は一般データの活用です。日本企業の多くがまだ第一段階にとどまっていると言えるでしょう。一般データだけでは、企業が求める回答を得ることは難しい。第二段階は、ドメイン固有のデータを活用し、業界に合った回答を出す。第三段階は、企業の専有データを使うことで、企業のニーズに合った回答を得る。データ活用段階が上がるほどに、セキュリティリスクは高くなります」
Articul8 AI
Head of Strategic Partnerships
Craig T. Doeden氏
生成AI活用においていかにデータを保護するか。「多くの企業は、AIモデルで社内の重要データを使う場合、クラウドに持って行くことにセキュテリィ面で不安を抱いています。Articul8は、ソフトウェアをお客様の環境の中に立ち上げます。お客様のデータ、トレーニング、推論を企業のセキュリティ境界内に維持し、セキュテリィの担保が可能です。インフラはオンプレミス、クラウド、プライベートクラウドを問いません」(Craig T. Doeden氏)
データ活用段階が上がるほどにセキュリティリスクが上がるため、対応が複雑になる
生成AIを活用するためには、LLM(大規模言語モデル)だけでなく、フルスタックのオーケストレーションが必要となる。「自社で対応するのは手間と時間がかかります。Articul8は、企業が独自の生成AIアプリケーションを構築するために必要なすべてのコンポーネントと機能を、すぐに使える状態で提供します。一般的に、生成AIアプリケーション導入は12カ月から18カ月を要します。Articul8の活用により6週間から12週間に導入期間の短縮が可能です」(Craig T. Doeden氏)
Articul8を提供するArticul8社はインテルから独立したが、戦略的パートナーとしての関係を強化している。金融、電気通信、製造業など様々な業界で導入されており、高いセキュテリィ、既存の技術スタックとの統合など企業の生成AI活用ニーズに応える能力は実証済みだ。Articul8 とGaudi® 3の組合せは、ソフトウェア、ハードウェアの両面から生成AI活用の課題を解決する。
「IBM Cloud + Gaudi® 3」
生成AIの幅広いユースケースに応える
日本アイ・ビー・エム株式会社
テクノロジー事業本部
クラウドプラットフォーム テクニカルセールス
シニアクラウドプラットフォームテクニカルスペシャリスト
森 大輔 氏
AIと言えばWatson(ワトソン)を思い浮かべる人も多いだろう。IBMは、Watsonのコア技術を進化させ、生成AIの基盤モデルのライフサイクルを管理し、学習モデルを作成、調整、配布するプラットフォーム「watsonx」を開発した。「watsonx」は、IBMのAIソリューションを支えるIBM Cloudのキーテクノロジーの1つだ。
日本アイ・ビー・エム株式会社
テクノロジー事業本部
クラウドプラットフォーム テクニカルセールス
シニアクラウドプラットフォームテクニカルスペシャリスト
森 大輔 氏
IBM Cloudは、Gaudi® 3を広く採用する最初のグローバル・クラウド・プロバイダーとなる。採用理由について、日本アイ・ビー・エム株式会社の森 大輔氏は話す。「注目したのは、Gaudi® 3の価格性能比です。今後の生成AI活用では、コストパフォーマンスに優れ、ビジネスニーズにフィットしたモデルを使いたいというニーズが一層高まっていきます。Gaudi® 3は解決策の1つになります」
IBM Cloudは、Gaudi® 3の価格性能比を高く評価して採用した
日本アイ・ビー・エム株式会社
テクノロジー事業本部
クラウドプラットフォーム テクニカルセールス
アドバイザリークラウドプラットフォームテクニカルスペシャリスト
比留川 敬之 氏
IBMが提供するAIソリューションは、真にオープンな基盤モデル(FM)「Granite」と、クラウドネイティブのスーパーコンピューター「Vela」の2つの革新的技術で支えられている。
日本アイ・ビー・エム株式会社
テクノロジー事業本部
クラウドプラットフォーム テクニカルセールス
アドバイザリークラウドプラットフォームテクニカルスペシャリスト
比留川 敬之 氏
Graniteは生成AI活用を促進するIBM独自の基盤モデルだ。他の基盤モデルと一線を画す。その特長について、日本アイ・ビー・エム株式会社の比留川 敬之氏は説明する。
「Graniteはオープンソース化しています。業界のコミュニティの中で、業界情報を共同で学習し公開することにより、業界全体で役立てることが可能です。また、モデルをダウンロードし、企業内のデータを用いて追加学習することで、企業固有の用途向けの「特化型AI」を構築することもできます。さらに、モデルの改善(メンテナンス)を、コミュニティ・モデルで行うためのプロセスも策定しており、これらのモデルはオープンソースプラットフォームHugging Faceで提供しています。2024年2月からGranite日本語版の提供も開始しました」
日本アイ・ビー・エム株式会社
テクノロジー事業本部
クラウドプラットフォーム テクニカルセールス
アソシエイトテクニカルスペシャリスト
鶴田 萌花 氏
本格化する生成AI時代を支えるためには、大規模な計算処理を可能にするスーパーコンピューターが必要となる。VelaはAIの処理に最適化されたクラウドネイティブなスーパーコンピューターだ。「一般的なスーパーコンピューターと異なるのは、多くのユーザーがパブリッククラウド・サービスとして利用しているIBM Cloud上にAI用として構成できるという点です」と日本アイ・ビー・エム株式会社の鶴田 萌花氏は話し、こう続ける。
日本アイ・ビー・エム株式会社
テクノロジー事業本部
クラウドプラットフォーム テクニカルセールス
アソシエイトテクニカルスペシャリスト
鶴田 萌花 氏
「AIワークロードに必要な大量のシステムリソースと、AIインフラに求められる高いスループットを実現します。またAI開発では、ハードウェアだけではなくソフトウェアによる効率性、スピードの向上を図ることが重要です。Velaは、IBM Cloudのスケーラビリティとクラウドネイティブなソフトウェアテクノロジーの長所を生かし、AI開発環境を最適化しています」
IBM Cloudは、製品の新規用途探索、気候変動と影響予測、スポーツのプレー解説と試合予測、新たな顧客接点の創出、製造業での労働災害予防など、幅広いユースケースに応えている。2025年1月、IBM Cloud でGaudi® 3を採用した「watsonx」など各種サービスを提供予定だ。「IBM Cloud + Gaudi® 3」によりAIモデルの開発スピードが更に促進され、ビジネスや暮らしの隅々に浸透していくだろう。
生成AI活用を拡大するためには、GPU一択では限界がある。Gaudi® 3は、生成AIプラットフォームArticul8、AIソリューション基盤IBM Cloudと一緒に新たな選択肢を提供する。GPUからGaudi® 3へのシフトは、生成AI時代のエコシステムを形成し、企業や社会の変革を加速するに違いない。

