ネットワークは円滑なビジネス遂行を支える重要なインフラである。そのネットワークが停止すれば、業務の停滞だけでなく、ビジネスチャンスの損失や企業の信頼低下など経営にも大きな影響を及ぼす。AIやクラウドなどデジタルサービスの利用の広がりに伴い、その重要性はますます高まっている。
しかし、一口にネットワーク障害といっても、その発生原因は多岐にわたる。調査や原因の特定に難航して障害の解消に時間がかかると、大きな問題に発展することもある。ユーザー企業のネットワーク・システム管理者、ネットワーク・システムの運用保守にかかわるベンダーやSIerの担当者には切実な課題だ。
なぜそうなるのか。理由はいくつかあるが、最新のネットワーク構成を把握できていないことが大きい。「ネットワーク機器の更新や追加がトポロジーマップに反映されていないと、どこで障害やボトルネックが起きているか分からない。その結果、影響範囲の調査や原因特定に時間がかかってしまうのです」とゾーホージャパンの喜村 亮介氏は指摘する。
通信がふくそうし、体感では表示速度やレスポンスが遅いと感じても、原因となる通信まで特定できないこともある。誰かが誤ってLANケーブルを抜いたり、新たに接続した時にすぐに気づけない。障害発生時にその根本原因が分からず、問題が繰り返し起こる。こうしたこともよくあるケースだ。
課題解決のためにまずやるべきことはネットワークの「一元監視」と「可視化」だ。「ネットワーク機器やその構成、ネットワークにつながる物理/仮想サーバーやクラウド上のサーバーまでマップ化し、ネットワークを流れるトラフィックもリアルタイムに可視化する。さらにネットワーク機器のポートの利用状況、アプリケーションやデータベースのパフォーマンスまで可視化が必要です」と喜村氏は説明する。
これにより「どこで、何が起きているか」を即座に把握できるようになる。原因が分かれば対処も迅速に行える。業務の停滞、それによるビジネスへの影響を極小化できるだろう。
とはいうものの、ネットワークの構成は複雑だ。通信を支えるだけでなく、トラフィックや、外部インターネットとの接続を制御するゲートウエイなどもある。ネットワークにつながるサーバーやデバイスの数も膨大だ。
可視化のために複数のツールを使い分けると、今度は運用が煩雑化してしまう。「複雑なネットワークを一元的に監視・可視化できる仕組みが欠かせません。それがシンプルで分かりやすいことも重要です」と喜村氏は説く。状況を瞬時に把握し、必要な情報にすぐにアクセスできなければ、本当の意味での可視化とはいえない。
こうした課題を解消するためにゾーホーが提供しているのがサーバー/ネットワーク統合監視ソリューション「OpManager Plus(オーピーマネージャー プラス)」だ。
同社は企業向けIT運用管理ツールやクラウド型ソリューションを提供するグローバルベンダー。日本では2001年よりビジネスを展開している。主力事業の1つが企業向けIT運用管理を扱う「ManageEngine(マネージエンジン)」だ。世界190カ国以上で約280万社の企業に利用されている。日本でも一般企業、官公庁や自治体を中心に8000ライセンスを超える販売実績がある。そのManageEngineシリーズの製品の1つがOpManager Plusだ。
OpManager Plusはネットワークのすべての階層を網羅的に把握・管理できるのが最大の特徴だ。サーバー・ネットワーク監視、IPアドレス・スイッチポート監視、ネットワークトラフィック解析、コンフィグ管理、ファイアウオールログ解析、アプリケーション性能管理、ストレージ監視などの機能がある(図1)。監視間隔やタイミング、CPUやメモリー、ディスク利用量の閾値設定は任意に変更可能だ。
図1 OpManager Plusの主要機能
ネットワーク階層構造の第1層から第7層までカバーする多様な機能を実装している。ネットワークやトラフィックの監視、可視化だけでなく、その後の運用を自動化する機能もある。運用の効率化・省力化の効果も大きい
ネットワークやトラフィックを可視化するだけでなく、ファームウエアのアップデートやパスワードの一括変更も自動化する。通信や外部からの攻撃、内部不正に関するログも自動で可視化する。ストレージの使用率を可視化し、ストレージ使用増加の予測も可能だ。人が行っていた監視や対策作業の多くを自動化できるのだ。
「あらゆるベンダーの様々な機器に対応するため、既存環境でも利用しやすい。機能の多くはエージェントレスで利用でき、導入も容易です」と喜村氏は語る。
ダッシュボードの分かりやすさもOpManager Plusの大きな特徴である。該当項目をドリルダウンしていけば、詳細な情報も簡単に確認可能だ(図2)。
図2 OpManager Plusのダッシュボード例
マップやグラフなどビジュアルを多用し、異常の有無や重要度も色分けして表示するなど直感的な内容だ。「今、どこで、どんな異常が起きていて、どんなアラートが上がっているのか」が一目で分かる
例えば、トポロジーマップは機器の接続関係を自動で可視化する。「機器の追加や入れ替えも自動で反映し、最新のネットワーク構成を視覚的に把握できるようになります」と喜村氏はメリットを述べる。
通信経路にふくそうが発生して帯域使用率が増加した場合は、そのルートを赤色で表示する。そこをクリックすれば詳細な通信フロー解析が可能だ。「『誰が、いつ、どこへ、どんな通信を、どれだけ行ったか』が一目で分かります。ふくそうの原因を容易かつスピーディに特定できるのです」と喜村氏は続ける。
気付きにくいLANケーブルの抜き差し状況も直感的に把握可能だ。パケットロスなどが発生しているスイッチやルーターのアイコンは赤色で示す。そこをクリックすればLAN端子の接続状況が表示される。ケーブルが抜けていたり、別の端子にケーブルが差し込まれていれば、間違いが視覚的に分かる上、アラートで通知が来る機能も備えている。
オプション機能の「APMインサイト」を活用すれば、Webアプリケーションのパフォーマンスも可視化することができる。アプリケーション内部の応答時間やCPU時間、トランザクションやデータスループット、利用済みメモリーなどを計測し、レスポンスの遅いメソッドやクエリを特定する。「パフォーマンス低下がアクセスの集中によるものか、リソースや帯域不足によるものか。原因が分かれば対策も立てやすくなります」と喜村氏は話す。
OpManager Plusは、海外はもちろん国内でも多くの導入実績がある。国内の某大学はSNMP監視、トラフィック監視を別ツールで使い分けていたが、これをOpManager Plusで一元化した。ダッシュボードでネットワークを俯瞰的に把握できるようになり、マウス操作で各機能にドリルダウンしながら調査が可能になった。ツールの使い分けが不要になっただけでなく、調査そのものがシンプル化し、障害発生時の調査と原因特定のスピードが大幅に向上。障害復旧も迅速化し、可用性の高いサービス提供が可能になったという。
ネットワーク運用保守の課題を解決するためには、幅広い監視を一元化し、それらを“分かりやすく”可視化することが重要だ。「OpManager Plusは障害やトラブルの発生及び原因特定に必要な情報を“分かりやすく”可視化し、問題解決の迅速化と運用の自動化を促進します」と喜村氏は語る。
OpManager Plusはモジュール型のスイート製品であり、料金は保守サポート込みで年間52万円から。また30日間無償で利用できる評価版も提供している。メールによるサポートやオンライン形式での評価支援も無償で受けられる。ネットワークの運用管理に課題を抱える企業はぜひ利用してみるといいだろう。