ITインフラSummit 2021 Review

DX推進に欠かせない安定したインフラ運用の実現
~マルチクラウド環境におけるネットワークの可視化と品質管理~

アイビーシー
プロダクト&サービス統括部 ソリューションサービス部
ディレクター/エバンジェリスト
明星 誠

DXによる変革で競争力強化を図るには、ITインフラの安定稼働が大前提となる。その実現には、適切なモニタリングを実施し、現状の把握から評価、問題解決、およびキャパシティ計画の立案を進めていく必要がある。「『システム稼働品質の向上』に貢献する」をミッションに掲げるアイビーシー(IBC)は、自社開発のネットワーク性能監視ツール「System Answer G3」によって、顧客に最適なモニタリング環境を提供し、DX推進を支えるインフラの安定稼働を実現する。

複雑化したインフラのモニタリング

アイビーシー
明星 誠

現在多くの企業が取り組んでいるDX推進。クラウドをはじめ各種サービスを活用しつつ、業務の変革を図っている。明星氏は、アナログデータをデジタルデータに変換する「デジタイゼーション」と、組織や事業などをデジタル技術で変革していく「デジタライゼーション」を定義し、「DXを進める際、デジタイゼーションとデジタライゼーションを組み合わせることが大切です」と話す。

DX推進によって、それを支えるITインフラに課題が生じ始めた。安定稼働が不可欠にもかかわらず、クラウドサービスやネットワークの品質低下、オンプレミス機器のキャパシティ不足などが起きている。

課題の一例がクラウドの運用監視だ。ハイブリッドクラウドやマルチクラウドが当たり前となるなど複雑化が進む。無論、主たる運用監視はサービス事業者が担うが、「問題なくサービスが提供されているのか、しっかりモニタリングするのはユーザーの責任です。その際、可視化や性能分析の体制が不十分では、障害の切り分けや原因特定など対応が困難になります」と明星氏は語る。

モニタリングの体制を整備する際は、インフラ環境の変化を念頭に置くことが肝要だ。クラウドの活性化に伴い、SD-WANやSASE(Secure Access Service Edge)が登場した。クラウドへのダイレクト接続など、インターネット接続方式も多様化している。また、コロナ禍を背景にリモートワークが常態化するなか、VPN装置のキャパシティ不足などのトラブルも以前より増した。

こういったインフラ環境の変化に伴い、モニタリングポイントも変化する。「機器自体の監視のみならず、エンドツーエンドでの通信品質監視も欠かせません。同じユーザーが同じ業務システムを利用していても、リモートワークか自社に在席しているのかで、経路や機器が大きく異なります。接続環境を理解したうえで、モニタリングポイントを適切に定めて監視し、ボトルネックなどを特定します」。

より詳細な監視/分析で隠れた問題を発見

モニタリングは性能と品質という2つの観点で行う。前者はマシンリソースやトラフィック流量などを監視する。後者はレスポンスをはじめ、エラーやコネクション数、再送数などを見る。

「性能の観点では、監視項目は機器ごとに変わるのはもちろん、監視間隔も従来の5~15分ではなく、もっと細かくすべきです。品質の観点では、実際にユーザーが快適に利用できることが目的であり、その実現のために遅延などを監視します」

さらに監視プロトコルもSNMPのみならず、WMIやIPMIなどへの対応が必要となる。

モニタリングしたデータをどう捉えるのかは、リアルタイムと定常的な分析という2つの観点で考える。リアルタイムについて明星氏は、「できる限りリアルタイムで状況の変化を検知して対処することが望まれます。古典的なしきい値による検知に加え、稼働状況に基づいた柔軟なアラート通知、機械学習による予兆検知といったより高度な手法も活用します」と説明する。

定常的な分析については、週次/月次といった単位時間での定期的な分析が基本となる。その際、レポート作成はツール利用などで省力化し、分析/対処に注力することが重要だ。

併せて、最近はより詳細なトラフィック監視/分析も求められる。「全体の流量の監視だけでは不十分であり、トラフィックの多いクライアントや宛先、通信プロトコルの特定、通信内訳の可視化まで求められます」と話す明星氏。通信内訳の可視化は、Microsoft 365の場合なら全体のトラフィックだけでなく、Outlook/ExchangeやTeams、SharePointなどサービス単位で細かく監視および可視化を行う。

バーストトラフィックの監視も、より詳細な実施が必要だ。従来のSNMPの監視周期では、細かな単位時間で突発的に発生した事象を正確に捉えきれないケースがある。

「例えば、1分間隔のSNMP監視にて、3Gbps程度のトラフィックと把握していたとします。これは1秒程度で平均化された値であり、実は500μ秒単位で解析したら、4Gbpsを超えるトラフィックが何度も発生していたと判明しました。より詳細な監視によって、隠れていた問題を探し出せます」

▲ページの先頭へ

INDEX