こうしたITインフラの運用業務を自動化するソリューションとしてレッドハットが提供しているのが、自動化プラットフォーム「Red Hat Ansible Automation Platform」(以下、Ansible)だ(図1)。特徴の1つは、APIによる多様なAI連携やシステム連携やインフラ操作の自動化、が可能なこと。OpenAIやGeminiなどの主要なAIと連携できるだけでなく、オンプレミスで運用するローカルLLMとも連携できる。
図1 Ansibleの利用イメージ
多様なシステムとの連携を自動化し、パブリック及びローカル環境のAIとも柔軟に連携可能だ。Playbookに定義した処理内容をもとに、人に依存していたさまざまな運用業務を自動化できる
[画像のクリックで拡大表示]
Ansibleは様々なタスクを実行するための豊富なモジュールを実装している。これをベースに必要な処理をPlaybookに記述することで、人が行っていた設定・運用作業などを自動化する。AnsibleではAI連携をサーバーやネットワークの自動化と同じ1つの自動化として扱うことができる。
「Ansibleを用いると、インフラエンジニアのスキルセットの延長線で、AIをインフラ運用に組み込むことが可能となります。」と中島氏はメリットを述べる。
例えば、サーバーからアラートが上がった場合、担当者は深夜・休日に関わらず即座の対応が求められる。対応手順書に従い、サーバーにログインしてログを確認。必要に応じてサーバーから解析用の情報も収集しなければならない。「Ansibleなら、こうした作業を自動化できるのです。ログの確認や情報収集だけでなく、AIによる解析や絞り込み分析も可能です」(中島氏)。
イベントの原因やそれに応じた対処を定義しておけば、多くの障害対応作業を自動化できる。サーバーのアラートだけでなく、セキュリティー侵害のアラート発生時もこうした自動化処理が可能だ。一刻を争うセキュリティーインシデントの場合は、ネットワークや端末の遮断などを迅速・的確に行い、被害の拡散を防止できる。さらに原因分析や影響範囲調査のための情報収集、ITSMツールやチケット管理ツールへの記録、関係者へのメールやチャットによる連絡など周辺作業も人手を介さずに行える。
ただその一方で、AIにすべてを任せることに懸念を持つ企業もあるだろう。そうしたケースでは「Policy enforcement for AI」を活用すればよい。これは、AIが実行しようとする自動化処理がコンプライアンスやポリシーに準拠しているかどうかを検証する「ガードレール機能」を有するツールだ。適切であれば、自動化が実行され、そうでなければコンプライアンスやポリシーに違反として実行がブロックされる。
また、AIの適用範囲を自由にコントロールできるのもAnsibleを用いたAIOpsの大きなポイントになる。「最初からAIによる本番システムの変更から始める必要はなく、環境非破壊のログの取得と分析などの変更を伴わない作業のみにAIを適用するだけでも十分な効果が上げられます。」と中島氏は語る。
元々Ansibleは大量のサーバーやネットワーク機器からログや設定情報を一括で収集することを得意とする。「単純なログ分析だけでも、Ansibleと組み合わせることで、複数のサーバーログの水平分析や、OS、MW、NWのログを垂直分析するなど自在に分析の自動化が実現できます」と中島氏は続ける。