システム環境の変化により、
従来の監視手法では不十分に
日本を代表するSIerの1社、NEC。同社がシステム開発を手掛ける際に意識しているのが、構築後のシステムの性能をどのように維持するかということだ。ウォーターフォール型のオンプレミスシステム構築プロジェクトを前提として、メソドロジーのほか負荷テストや性能測定を担うツールセットを展開。自社製の性能分析ツールも用いることで、システムの監視と可視化に注力してきた。
「自社製の性能分析ツールはOSにインストールされており、例えばアプリケーションの個々のプロセスの挙動をトレースし、可視化する役割を担います」とNECの門脇 一馬氏は説明する。ミッションクリティカルシステムの構築を手掛けるケースが多いこともあり、システムの中身を可視化することにはかねて強くこだわってきたという。
だが、近年は課題が浮上していた。求められるシステムの形が変わるにつれ、既存の可視化・性能分析手法では不十分になりつつあったのである。
「例えば、as a Serviceの普及による変化はその1つです。クラウドサービスの運用管理の多くはクラウド事業者側で行われるため、既存の監視手法で可視化できる範囲がどんどん縮小していました」(門脇氏)
システムの構成も変化している。マイクロサービスなどのクラウドネイティブな分散アーキテクチャを採用したシステムが増加する中で、性能上のボトルネック要因を把握しにくくなっていた。
オブザーバビリティ実現の
3つのポイント
そこでNECが、新たなアプローチとして注目したのがオブザーバビリティ(可観測性)である。システムの状態を継続的に可視化するとともに、変化や異常に対し速やかに対応できるようにする。具体的には、「メトリクス」「トレース」「ログ」の3つを可視化することが重要だとNECは考えた。
メトリクスは、ITリソースの使用状況やHTTPリクエスト数など、数値で収集・集計可能なデータの集合のことを指す。トレースはサービス間のトレースやアプリケーショントレースなど、単一トランザクションを構成する機能呼び出しのフローである。これをしっかり収集・可視化することで、システムに発生した異常の検知やアラート発報が可能になる。そしてログは、アクセスログやエラーログなど、個々の機能が発生するイベントを記録したもの。問題発生時の分析に用いる。
「この3つを常時参照可能な状態をつくり、システムの内部状態をデバッグなしで観測できる状態にしておくことが、当社におけるオブザーバビリティの基本的な考え方です」と門脇氏は語る。
これを実現する仕組みとして主要な役割を担っているのが、New Relicのオブザーバビリティプラットフォームだ。
New Relicはクライアントからサーバーまで、トランザクション観点でITシステムの性能監視や分析を行うことができるサービス/ツール群。テストフェーズの性能分析にも活用できるため、開発中のシステム性能不良箇所が発見された際などに、アプリケーションが実際にどんな動きをしたのかを速やかに確認できる(図1)。
図1 New Relicのオブザーバビリティプラットフォーム
データ集約からシステム全スタックの可視化、洞察に基づく改善アクションの実行まで、オブザーバビリティを実現するためのサービスとツール群をオールインワンで提供する
「NEC様が直面した課題の通り、システムのモダン化に伴う複雑化によって、従来の監視による運用は限界を迎えています。ITモダナイゼーションにおいては、運用のモダナイゼーションも並行して考えることが不可欠なのです」とNew Relicの松本 孝希氏は語る。
現在は、オンプレミスに存在する静的なリソースはもちろん、クラウド上のサーバレス/コンテナ環境も含めたすべてのシステムを一元的に観測できる仕組みが求められている。また、観測する際の視点も従来通りではいけない。複雑化したアプリケーションをポイントごとに見ていても、問題の兆候や発生原因を特定するのは難しいからだ。「よりユーザーに近い位置からエンドツーエンドで観測・可視化することが大切です。New Relicは、これらの要請を満たす仕組みを単一のプラットフォームで提供します」と松本氏は強調する。
NEC自身のシステムの
可観測性向上にも活用
NECは、既に多くの顧客プロジェクトでNew Relicを活用し成果につなげている。
一例が、ある金融業界の企業におけるオブザーバビリティ導入だ。この企業では、エンドユーザー向けのWebサイトの基盤をクラウドにリフトしたが、そこで性能問題が発生。同時に、問題の発生自体に気付くのが遅れる、原因分析に時間がかかるといった課題にも直面したという。
そこでNECは、New Relicによるシステム状態の可視化を提案。「アプリケーションを含めたシステムの稼働状況の可視化、ダッシュボードによる担当部署を横断した状況の共有化、過去の傾向との比較・分析などを可能にし、性能問題に対してプロアクティブに対応できるようにしました」と門脇氏は紹介する。
負荷テストツールとNew Relicを組み合わせることで、性能テスト時の問題箇所の早期検出と原因究明作業を高度化する取り組みも行ったという(図2)。
図2 性能テストにもオブザーバビリティを活用
NECは負荷テストツールとNew Relicを組み合わせることで、性能テスト時の問題箇所の早期検出と原因究明作業を高度化。ロジック上の問題点やリソース割り当ての不足箇所を特定し、問題解決までの時間を短縮している
「総合テストフェーズにおいて高負荷時の全体的な応答時間の不良や、スパイクによる極端な応答時間の遅延が発覚し、New Relicによる分析を実施しました。これによりロジック上の問題点や、リソース割り当ての不足箇所を特定し、分析開始からわずか数日で問題を解決することができました」(門脇氏)
また別の事例では、長時間運用時に性能劣化が発生した際、開発環境での再現試験にNew Relicを活用することで被疑箇所を迅速に特定。それまで多くの手間をかけていた性能テストにおける各種分析工程を、オブザーバビリティの実装によって大幅に効率化したという。
「加えてNECでは、社内システムのオブザーバビリティプラットフォームとしてもNew Relicを活用しています。アプリケーションの性能分析に活用を開始しており、従来型のアーキテクチャからCaaS/PaaS活用アプリケーションまで、状態や性能の一元的な管理が容易になりました」と門脇氏は続ける。
特に大規模なITモダナイゼーションプロジェクトでは、システムに潜む性能上の問題点を早期に洗い出す必要がある。実際の運用フェーズはもちろん、テストフェーズの可観測性向上にも活用できるNew Relicは、有力な選択肢となるだろう。
関連リンクRelated Links
CONTACT
New Relic株式会社
マーケティング
e-mail:japan_marketing@newrelic.com



