従来型ツールによる運用監視の限界を超えた「オブザーバビリティ」を備える統合監視の姿とは?【開催ウェビナーサマリー】

【はじめに】

2023年11月17日、マジセミにて弊社主催で「クラウド/オンプレ混在、複雑なネットワーク、性能監視・・・従来型ツールの限界と今後の運用監視のあり方 ~実例に学ぶ! 大手流通業がサイロ化したIT管理を簡素化した事例紹介~」というセミナーを開催しました。

 同セミナーでは、弊社と10年以上のパートナーシップを持つジュピターテクノロジーが登壇。複雑化するIT運用を解決する「オブザーバビリティ」を備えた統合監視ソリューション「SolarWinds Hybrid Cloud Observability」の特徴や強み、実際のお客様事例などをご紹介しました。この記事では、同講演のポイントをお伝えします。

 

■ハイブリッドクラウド化でサイロ化するネットワーク管理 今、求められる「オブザーバビリティ」とは?

 まず初めに、昨今の変化とIT運用の課題を整理し、オブザーバビリティが求められる背景について解説しました。

 現在の企業のIT環境は、急速に変化し続けています。オンプレミスとクラウドの混在、多様なデバイスの利用、マルチメディア型コミュニケーションツールの台頭といった要因がとなりITシステムの高度化を推進しています。その一方で、IT運用の問題解決が困難になっているのが現状です。

 このような背景下では、IT運用における「サイロ化」が顕著な問題となっています。サイロ化された運用とは、ネットワーク管理とアプリケーション管理が分断され、各担当者や拠点ごとに異なるツールが使用されている状況を指します。そうした環境では、問題発生時の原因究明が難しくなり、迅速な対応が求められる中でのその解決が遅れることもあります。

 

障害発生時の原因究明は、新しい技術の導入とともに新たな問題が発生したことで、対処する過程が以前にも増して複雑になっています。これは、IT管理に新たな考え方、すなわち広い視野での問題解決アプローチが必要であることを示しています。

 さらに、各種IT運用の現状を見ると、高度化と複雑化が進む中での対応策として、経営層からもスピーディーな対応が求められるようになっています。社会の目は厳しく、例えば銀行のATMが停止したり、航空券の予約システムがダウンすると、それがすぐにソーシャルメディアで報告され、企業のブランドに悪影響を及ぼす可能性があります。

 

このような状況の中で、従来の監視から一歩進んだ「オブザーバビリティ」への転換が、より重要になってきています。

 オブザーバビリティとは、複数のITフィールドからの情報を統合し、全体を俯瞰することで問題の根本原因を容易に特定できるようにするアプローチです。これにより、データの比較が容易になり、問題解決に必要な全体像を把握できるようになります。

 

【図】SWI資料(P10)

ITのサイロ化した「監視」から「オブザービリティ」へ

 

具体的には、従来の死活監視やデータ監視から進化し、異なる監視要素を統合し、より広い範囲で問題を捉えることができる「総合的な監視」が必要です。これがオブザーバビリティです。たとえば、あるウェブサイトへのアクセスが失敗した際、アプリケーションだけでなく、ネットワークやその他のインフラも含めた全体を見ることができれば、迅速かつ効率的に問題を解決できるのです。

 こうしたオブザーバビリティの導入により、IT運用は新たな段階へと進むことが期待されます。そして、それは組織全体にとっても、より効果的なIT環境の維持に寄与することになるでしょう。

 

■障害監視の課題を解決できる、オブザーバビリティを備えた統合監視の理想形「SolarWinds HCO」

 続いて、複雑化するIT運用に求められる「オブザーバビリティ」を備えた統合監視ソリューション「SolarWinds Hybrid Cloud Observability」の概要を説明しました。

 現代のIT環境は複雑性が増す一方で、それに伴いシステムの監視と管理の重要性が高まっています。この課題に対応するため、SolarWindsでは「SolarWinds Hybrid Cloud Observability(以下、HCO)」を提供しており、全てのITインフラ環境をシンプルに一元管理するオブザーバビリティを実現しています。

 HCOは、サイロ化された監視ツールを超え、統合された監視環境を実現します。従来、複数の監視ツールを使って異なるフォーマットのデータを収集し、それを手動で突き合わせて原因分析を行うのは大変な労力と時間が必要でした。特に、データのフォーマットが異なる場合、単純な並べ替え作業にも多大な労力を要し、間違いの発生も避けられませんでした。

 しかし、HCOが提供する各種機能を活用することで、そうした運用負荷を軽減できます。

たとえば、「PerfStack」機能では、複数のデバイスからのデータをWebベースのGUI上でドラッグ&ドロップすると同一時系列で直接比較することができます。特定のイベントが発生した際の様々なデータを視覚的に重ね合わせることで、迅速かつ正確に複数情報の相関分析を実現します。

 さらに、ネットワークの全体像を階層的に可視化する「マップ機能」を提供しています。マップ機能では、ネットワーク全体マップの目視、または問題発生時のアラートにより、問題の発生(予兆)をいち早く検知し、さらに階層的に作られたマップをドリルダウンして、問題の発生箇所を特定します。問題が発生しているノードの詳細情報を基に、起きている問題の詳細とその対処を実施するために役立てられます。

 代表的な機能としては「NetPath機能」も挙げられます。ネットワークの経路監視を強化し、特にクラウド環境へのアクセス問題を解析するのに役立ちます。例えば、オンプレ機器で何かループが発生する事象が起きた場合、問題の内容を確認した上でドリルダウンし、問題発生前後の設定内容を比較できます。

 

HCOは「SolarWinds Platform」を基盤としており、その上で多様な監視・管理モジュールが動作します。これにより、ネットワーク、サーバー、アプリケーションなどの幅広いITコンポーネントを一元的に監視し、問題を迅速に解決するための詳細な情報を提供します。また、各モジュールが連携してオブザーバビリティとして動作します。

 HCOを構成するモジュール群は、オブザーバビリティを実現する様々な機能を提供しています。

【図】SWI資料p21

HCOオブザービリティを構成するモジュール群

 

また、HCOは「Essentials」と「Advanced」という二つのエディションで提供されます。それぞれが異なるニーズに応じた機能を備えています。また、シンプルなノードベースのライセンス体系を採用しており、管理するデバイスの数に基づいてコストを抑えることが可能です。

オブザーバビリティという概念は、高度化・複雑化が進む昨今のITシステムにおけるプロアクティブで最適な問題解決のためのアプローチだと考えています。HCOは、オンプレミス/クラウドが混在するIT環境の運用管理を統合的にシンプルに、かつ強力に貢献できるソリューションだと自負しています。 

SolarWinds HCOの強みである3つの主要機能 ネットワーク管理を効率化するモジュール活用法

 次に、弊社のパートナー企業のジュピターテクノロジーから、実案件におけるSolarWinds HCOのモジュール活用例を紹介しました。主要な3つの機能である「自動マップ作成機能」「カスタム可能な高機能アラート」「NetPath機能」に焦点を当てて、それぞれの機能がどのようにネットワーク管理を効率化するかについてデモを交えて詳しく解説しました。

 まず、「自動マップ作成」機能です。同機能は、ネットワーク構成の変更や拡張が行われる現代のIT環境において、ネットワークマップを自動で生成します。従来の手動でのマップ作成では、時間とコストがかかる上にヒューマンエラーのリスクも伴います。

 

【図】JT様資料p6

自動マップ作成機能の例

 

しかし、HCOの自動マップ作成機能を使用すれば、隣接する機器の情報を自動的に取得し、結線してくれるため、時間とコストやリスクを大幅に削減し、運用の効率化を図ることができます。この機能は、特に複雑で大規模なネットワークを持つ企業にとって、運用負担の軽減と迅速な問題解決の両方を実現します。

 次に「カスタム可能な高機能アラート」機能です。一般的な監視環境では、アラートの発報を通知する機能はありますが、通知を受けただけではアラートの詳細情報までは把握できません。そのため、ライトが点灯するたびに、WebGUIを開いて、そこから状況を確認するといった運用がなされています。

 それに対して、HCOでは高機能のアラートとアラートアクションとの連携により、数値を見るだけで、詳細情報の確認までが可能な運用監視を実現いたします。また、アラートの通知だけでなく、アラート発生時の詳細な情報も提供します。さらに「通知メール」機能をはじめとする多様なアクションを設定でき、これにより迅速な対応を支援します。

 

【図】JT様資料p9

カスタム可能な高機能アラートの例

 

最後に「NetPath」機能です。この機能は、ネットワークの問題発生箇所を特定するために非常に有効です。NetPathはネットワークの経路を視覚化し、各ホップのパフォーマンスデータを提供します。これを活用することで、問題の根本原因を迅速に突き止めることが可能です。

 例えば、Office365へのアクセスが遅いと報告された場合、NetPathを使用して問題が発生している具体的なネットワークパスを特定し、適切な対策を速やかに実施ができます。時間を要していたトラブルシューティングの工程が大幅に短縮され、サービスの品質維持に直結します。

 

【図】JT様資料p11

NetPath機能による障害追跡の例

 

 

これらの機能を活用することで、HCOは、トラフィック分析からIPアドレス管理、ネットワーク監視、コンフィグ管理に至るまで、幅広い監視と管理を一元的に実行可能になります。また、各モジュールはシームレスに連携し、複数の監視情報を統合的に管理できます。HCOの導入により、企業はITインフラの複雑性を効果的に管理し、運用コストの削減と効率化を実現できます。

 

■大手流通業がサイロ化したIT管理を簡素化した事例を紹介

 

最後に、ジュピターテクノロジーが実際に携わったHCO導入事例として、大手流通業者の既存管監視ソフトウェア環境からの移行事例での取り組みを紹介しました。

 

この企業は、全国に約300の拠点と約5000台の設置機器を保有し、同システム環境の効率的な監視が求められていました。同社の監視要件は「既存環境の複雑なアラート設定を踏襲できる」「約5000台のNW機器のコンフィグを一括管理できる」「NetFlowのトラフィック監視ができる」「IPアドレス管理ができる」ことでした。また、既存環境では「サイロ化した監視環境」「属人化しやすい監視ルール」という課題を抱えていました。

 

HCOの各モジュールを活用することで、こうした要望や課題解決を実現しています。

 

まず、アラート設定の踏襲では、「Network Performance Monitor(NPM)」と連携する高機能アラートを活用しました。また、直感的な操作性のWeb GUI画面は属人化の課題解決にもつながりました。

 

また、ネットワーク機器のコンフィグの一括管理は「NCM(Network Configuration Manager)」によって実現しました。NCMは、コンフィグダウンロード、変更の検知、世代管理などを自動で実行できるモジュールです。同モジュールによって、5000台の機器のコンフィグ管理を全て自動化しました。

 

ネットフローのトラフィック監視を実現したのが「NTA(NetFlow Traffic Analyzer)」です。NTAを活用して、トラフィック量と通信内容の可視化、帯域で使用しているアプリケーションや通信先を分析できる環境を構築しました。

 

さらに、IPアドレス管理の自動化は「IPAM(IP Address Manager)」の導入で実現しました。以前は「Microsoft Excel」で手動管理していたIPアドレスの管理が全自動化されました。これにより、IPアドレスの利用状況が正確に把握できるようになり、重複や誤りも自動で検出することが可能となりました。

 

HCOを導入することで、これまで異なるメーカーや監視ソフトで構築されていた監視環境が単一システム上に統合されました。サイロ化した監視環境の課題を解消し、大規模な環境を統合監視できる体制を実現しています。

 

今回のセミナーを通して、SolarWinds HCOが実現するオブザーバビリティについてご理解いただけたのではないでしょうか。IT環境の運用管理で課題をお持ちの方や、この記事を通してご興味を持たれた方は、ぜひ、SolarWinds Japanにお問い合わせくださいませ。

 

製品情報はこちら

https://www.solarwinds.com/ja/hybrid-cloud-observability

 

問い合わせはこちら

https://www.solarwinds.com/ja/company/contact-us