AI・デジタルツイン・データ基盤Forum
Elasticsearch
プリンシパルソリューションアーキテクト
古久保 武雄 氏
システムが出力するログや運用知識などは、企業内部に閉じた非公開データである。これら非公開データをLLMに渡すやり方は、大きく2つある。ファインチューニングとRAG(Retrieval-Augmented Generation、検索拡張生成)である。
ファインチューニングは、LLMを追加データで学習させる方法だが、弱点が多い。AIモデルを学習するための知識やノウハウが必要で、学習のための計算資源(コスト)や時間も必要になる。また、監視対象のシステムは変化し続けているので、継続的に学習させる必要がある。
一方、RAGは、学習していない知識を活用する方法として現実的である。文書の検索によって得られたデータを、コンテキストとして生成AIのプロンプトに与え、非公開データを利用した回答を得るというテクニックである。生成AIから見ればプロンプトの工夫に相当する。
例えば、「確定拠出年金の加入方法を調べる」といった、個々の会社によって異なる知識を調べるケースでRAGが役に立つ。質問と一緒に、正解となるデータを生成AIのプロンプトに渡すことで、正解となる知識を含んだ回答が得られる。
Elasticは、検索エンジンを中核に、RAGを構成するためのAI関連ツール一式を提供している。検索については、キーワード検索も、類似度を調べるベクトル検索も、これらを組み合わせた検索もできる。関連度の高い順に結果を返すので、これを質問とともにLLMに渡せる。
ITの運用にRAGを適用する具体的なイメージは、AIアシスタントである。エラーメッセージやアラートを要約させたり、次にとるべきアクションを提示させたりできる。ログ発生時に運用マニュアルを調べて対処する、といった作業を自動化できる。
「エラーメッセージやアラートを見ても、運用のスキルがないと、どのように対処してよいのかが分かりません。RAG構成のAIアシスタントを使えば、運用スキルがない人でも、エラーメッセージから運用手順書などのナレッジを検索し、生成AIに答えさせることができます」(古久保氏)
運用手順書などのナレッジをRAGの検索対象に追加するための仕組みもElasticは用意している。JIRAやServiceNowなどのチケット管理システムにはシステム運用ナレッジがたまっているが、これらを取り込むためのコネクターツールを用意している。
取り込みたいデータソースを選んでマウスでクリックするだけで、データをインデックス化し、検索対象にできる。ファイルサーバー上に置いて日々更新しているPDFファイルやExcelファイルも、クロールしてナレッジとしてインデックス化できる。
デモンストレーションでは、可視化ツールのKibanaの画面でAPM(アプリケーション性能管理)のエラーメッセージを確認し、生成AIによる運用手順を得る様子を見せた。この裏では、あらかじめナレッジとしてインデックス化しておいた運用手順書を、エラーメッセージをもとに検索し、検索結果を生成AIに渡している。
生成AIをIT運用に活用するもう1つのユースケースとして、大量のアラートを分類して攻撃のパターンを明らかにする使い方がある。大量のアラートが発生した際に、これらのアラートを分類する作業負荷は大きいので、これをAIに任せる。誰のPCが攻撃を受けているかといった詳細も分かる。
Elasticは、通常時とは異なるログを機械学習で検出可能なツールとして、大量ログを分析するツール「AIOps Labs」も用意している。例えば、ログが急増した際に、何が起こっているのかを調べられる。「PostgreSQL関連のログがほとんどを占める」といったことが分かる。
古久保氏は、「インフラ運用監視の主役は人間ですが、AIが手助けできます。では、どこまで助けられるのか。いかに早く正解データを障害に適用するかがポイントになります」と、IT運用の秘訣を説く。「高速な検索技術と、欲しい情報を正しく持ってくる技術が重要です。この部分は、検索から始まったElasticに強みがあります」(古久保氏)。
関連リンク