クラウドやコンテナの活用が進み、システムは分散型へと移行した。課題は、複雑化したシステムがどのように動いているのかを把握しにくいことだ。これを解決する鍵が、可視化・監視の先にあるオブザーバビリティ(可観測性)である。しかし実装の障壁となるのが監視ツールのベンダーロックインだ。OSSの標準規格OpenTelemetry(OTel)はこの構造を変えつつある。では、OTel時代のオブザーバビリティ基盤はどうあるべきか。グラファナラボ日本合同会社シニアソリューションズエンジニア角田勝義氏が、運用監視のパラダイムシフトを解説する。
「監視」の先へ行く道を阻む
ベンダーロックイン
システムの状況を見るだけの「監視」から、内部状態を把握する「オブザーバビリティ」へといかに移行するか。最大の障壁が監視ツールのベンダーロックインだ。
シニアソリューションズエンジニア
角田 勝義 氏
「DX推進やAI活用の加速に伴い、監視対象は拡大しています。多くの企業が複数の監視ツールを導入し、運用は複雑化しています。障害時の要因切り分けの難しさ、ツールごとのスキル習得、仕様理解など負担は増す一方です。統合が理想ですが容易ではありません。ツール専用エージェントを各サーバーに導入しているため、ベンダーロックインにより移行が困難だからです」(角田氏)
個別最適の監視ツールはデータのサイロ化を招き、オブザーバビリティ実現の阻害要因となる。これを打破するのがOSSの標準規格「OpenTelemetry」だ。特定ツールに依存せず、メトリクス、ログ、トレースといったテレメトリデータを収集できる。今、関心が高まる理由はそこにある。
オブザーバビリティ・プラットフォーム「Grafana(グラファナ)」は、OTelの考え方に呼応する。ベンダーロックインを回避し、多様なデータソースを一元的に収集・分析、可視化できる。OSS版をエンタープライズ向けに最適化し、フルマネージドで提供するのがGrafana Cloudだ。Prometheusなどのオープンスタンダードをネイティブでサポートし、既存監視ツールやテレメトリをそのまま活用できる。
Grafana Cloud導入は国内外で拡大している。Grafana Cloudは、OTelのもとでエコシステムを形成しオブザーバビリティを実現する。「また、OSSの監視プラットフォームPrometheusなどのオープンスタンダードをGrafana Cloudはネイティブでサポートしており、既存監視ツールやテレメトリをそのまま活用できます」(角田氏)
オブザーバビリティの実現は、既存の運用監視環境が存在する中でビッグバン的に進めるのは難しい。
「運用監視のあるべき姿を見据え、現実的に進めることが重要です。ベンダーロックインを回避し、システム全体を詳細に把握できるダッシュボード作成がファーストステップとなります。Grafana Cloudにより、ログ、メトリクス、トレース、データベース、ITSMなど異なる監視ツールの可視化データを収集し、1つの画面で見ることができます。ログのエラーとCPU情報を合わせて確認することで、要因特定の迅速化や新たな気づきが得られます」(角田氏)
現場エンジニアのために
AIエージェントが自律的に動く
これからのオブザーバビリティでは、運用の効率化・高度化に向けてAI活用が欠かせない。Grafana CloudにはOSS版にはないAIエージェントがある。「Actually useful AI(実務に役立つAI)」として、現場エンジニアのために自律的に動く。
「例えば、『アプリケーション性能を図る指標となるダッシュボードを作ってほしい』と自然言語で指示するだけで作成します。クエリを書く必要はありません。ダッシュボードに関する知見やスキルが不足していても、すぐに利用できます」(角田氏)
代表的な活用シーンがRCA(根本原因分析)の迅速化だ。
「一般的に日本企業ではアプリケーション開発をベンダーに依頼するケースが多く、社内にアプリケーションの中身が分かる人材がいないのが現状です。Grafana Cloudでメトリクス、ログ、トレースを統合管理することで、Grafana Assistantがインフラだけでなくアプリケーションレイヤーの問題を分析し、解決策や対策も提示します。人では困難だった100台規模のサーバー調査も同時に可能です」(角田氏)
“アラート疲れ”の解消にも役立つ。
「頻繁に発生しているアラートを抽出し、『どこに目を向けるべきか』を示唆します。それをもとにしきい値を見直すことで最適化が図れます」(角田氏)
オブザーバビリティツール選定基準は
「コスト」と「使いやすさ」の2つだ
2025年にGrafana Labsは「日本におけるオブザーバビリティ動向調査」を実施した。その結果、オブザーバビリティツールの重要な選定基準として「コスト」(82%)、「使いやすさ」(62%)が上位を占め、いずれもグローバルと比べて高い割合となった。また、オブザーバビリティに関する懸念点でも「コスト」(48%)が最も多かった。
監視データの爆発的増加に伴い、従量課金制の運用監視サービスを利用する企業ではコスト増大が深刻化している。
「課題の本質は、膨大な不要データも課金対象になる点です。これを解決するのが、データの必要・不要を判別する技術であるAdaptive Telemetryです。Grafana Cloudはこれを提供できます」(角田氏)
「不要なデータの基準は、そのデータが使われているかどうかです。Grafana Labsが開発したAdaptive Telemetryは、独自の統計モデルでデータの利用状況を分析し、集約や削減に関する推奨事項を提示します。2023年のリリース以降、導入企業数は3900社を超え、平均コスト削減率は20%~50%です」(角田氏)
Grafana Cloudはサーバー管理が不要で、バージョンアップもGrafana Labsが行う。そのため運用管理負荷を軽減し、最新機能を迅速に利用できる。Grafana AssistantやAdaptive TelemetryなどOSS版にはない機能により、運用管理を高度化できる。Grafanaのメリットを最大限に生かし、エンタープライズ向けに付加価値を提供する。
2025年11月、Grafana Labsは日本法人を設立し、国内支援体制を強化した。Grafana Cloudはオブザーバビリティにおける現在と将来の課題を解決し、企業の持続的成長を支える。


