ITインフラSummit 2019 夏

システム監視技術の高度な知見により
企業のITインフラの安定稼働を支える

アイビーシー
プロダクト&サービス統括部
担当部長 エバンジェリスト
明星 誠

ITインフラの安定稼働は、今日の企業においてビジネスの実践にかかわる切実な命題である。しかし、ますます複雑化、高度化を遂げるシステム環境にあって、そうした要請を満たすには、高度なスキルと膨大な工数を要するという問題がある。アイビーシーでは自社開発したシステム情報管理ソフトウェア「System Answer」に、先進的技術開発の成果を注入。ITインフラの監視、運用管理にかかわる次世代のアプローチを提案している。

複雑化するITインフラにかかわる
監視品質の維持と工数削減に向けて

アイビーシー
プロダクト&サービス統括部
担当部長 エバンジェリスト
明星 誠

今日のビジネス活動の根幹を担っているともいえるITインフラの安定稼働は、企業にとってはまさしく生命線である。「ただし、システムが抱える性能問題を分析・検証し、その解決を図っていくためには、高度なスキルが求められるうえ、運用管理にかかる工数も膨大。それが、企業にとって切実な課題となっています」とアイビーシーの明星誠氏は指摘する。このような課題の解消には、ITインフラの監視、運用管理にかかわる高度な知見が組み込まれたツールを導入し、適正に運用していくことこそが肝要である。

アイビーシーが提供する「System Answer」は、まさにそうした要請に応える製品だ。その活用により企業は、社内はもちろん、データセンター、さらにはクラウドを含む環境において稼働する、サーバーやネットワーク機器、ストレージなどマルチベンダーで構成される多様なITインフラの稼働状況を一元的に監視、管理することができる。

「現在の『System Answer G3』にバージョンアップする際に、市場のニーズを見据えて注力ポイントとしたのが監視の自動化。これにより、監視・運用管理にかかわる工数削減、監視の抜け漏れ回避による監視品質の維持というメリットを追求しています」と明星氏は紹介する。

ノード登録から監視項目のメンテナンスまで
状況に応じた監視の自動化を実現

監視の自動化にあたって課題となったのが、障害やメンテナンスといった状況によって変化する監視要件への追従だ。もちろん、検知された問題への対処として機器を無効化する際にも、障害かメンテナンスかという状況の見極めが必要だ。さらに一定のポリシーで監視ステータスを柔軟に変更できる必要もある。つまり、「System Answer」における監視の自動化はこうした要求を満たすかたちで実装されているわけだ。

「System Answer」の自動監視登録は、大きく「ノード登録」「監視項目の登録」「ノード情報の更新」、そして「監視項目のメンテナンス」という4つのステップで捉えることができる。

まず最初のステップとなるノード登録については、IPアドレスの決め打ちによる登録に加え、セグメントやアドレスの範囲を決めて登録することが可能。「範囲による登録を可能にすることで、『System Answer』では個々の機器を単位とするのではなく、システムを単位とする監視を実現している点が大きな特長となっています」と明星氏は説明する。

ノード登録に続く監視項目の登録では、ノードごとに、例えばトラフィックやCPUにかかわる情報など任意の取得項目を登録することになるが、これに関し「System Answer」ではテンプレートを用意。そこに設定したプライオリティに沿った自動登録が行える。また、インターフェースのタイプやディスクボリュームなどにより絞り込みを行って監視登録を行いたいというニーズにも応えている。

さらに3つめのステップとなるノード情報の更新だが、これはノード登録されたセグメント、アドレス範囲、IPアドレスに沿って、一定周期でノード情報、インターフェース情報を更新していくというものだ。「例えば、拡張されたディスクボリュームを監視対象に加えるとか、インターフェースのステータスがオンになったので監視対象にするといった更新を行うわけです」と明星氏は言う。

そして、4つめのステップである監視項目のメンテナンスについては、機器からのレスポンスのタイムアウトをアラートとして検知し、例えばSNMPで監視をしているときに取得値がなくなったようなケースでは、その旨をイベントとして通知する。さらにその状態が一定期間継続したら、該当する監視項目やノードの無効化を自動で行えるようになっている。

アノマリ検知の積極的採用が
監視アプローチに変革をもたらす

以上のような監視の自動化のほか、アイビーシーの監視ソリューションにおける1つの目玉となっているのが、アノマリ検知にかかわる取り組みである。「アノマリ検知については、数年前からよく耳にするキーワードとなっていますが、明らかな障害として検知が困難なサイレント障害の発見や、障害であるかどうかは定かではないが、いつもとは違う挙動の検知、あるいは致命的な状況に陥る前に障害予兆をいち早く捉えるといった局面での期待が高まっています」と明星氏は紹介する。監視ツールの機能として実装する以外にも、現状の監視の仕組みにこのアノマリ検知の考え方を取り入れることで効果が期待できる。

アノマリ検知に関してアイビーシーが検討を進める分析手法は、固定的なしきい値との比較に加え、過去の値との比較、他システムとの比較を行うというものだ。これにより、これまで固定的なしきい値では検知しにくかった4つの事象を捉えることができる。

まず1つめが、ずっと一定だった値がしきい値にかからない程度に上昇(下降)して、ある値で安定しているようなケース。2つめは、ずっと安定していた値が上昇(下降)し始めるケース。「この場合、やがてしきい値に達することになりますが、値が変化し始めた、できるだけ早いタイミングで事象を捉えることができるわけです」と明星氏は語る。そして3つめは、上昇すべき値が通常どおりに上昇し切らない。トラフィックでいえばスローダウンのような事象である。そして4つめは、いつもはゼロであるはずの値が突発的に上昇(下降)するケースだ。

これに対し「System Answer」では、例えば突発的な値の変化については前回の値と今回の値を比較するという監視を継続していくことで、値の上昇と下降を交互に繰り返しているのか、単に上昇(下降)し続けているのかを把握できる。独自のトレンド値という値を設けて、継続的に上昇(下降)し続けているケースに気づけるようなトレンド分析の仕組みを実装している。

また、周期的な値の変化については、変動する値を学習してベースラインを作成することで、揺らぎを考慮した標準偏差により異常値を見つけるというアプローチをとっている。そこでは、周期性は統計上信頼のおける程度の学習母数が必要なため、曜日と時間帯ごとに集計するというかたちをとっている。こうした機能により、固定的なしきい値だけでは気づけないような異常を捉えることができるわけだ。

そのほか、アイビーシーでは詳細な機器性能情報の取得手法として注目されるテレメトリー(Telemetry)についても、APRESIA Systemsと共同で継続的なマイクロバーストトラフィックの監視手法を開発した。さらなる連携強化により、より深いマイクロバーストトラフィックの調査や分析の実現を進めているところだ。

「今後もアイビーシーでは、テレメトリーを始めとしたアノマリ検知などの新技術への取り組みをさらに強化しながら、その独自の知見、ノウハウをベースに、お客様のITインフラの運用管理をめぐる課題解消に貢献していきます」と明星氏は力強く語る。

お問い合わせ

アイビーシー

https://www.ibc21.co.jp/

▲ページの先頭へ