ソーラーウインズの小宮です。


今回はServer & Application Monitor(以下SAMで記載します)のEditionに含めている機能でApplication Stack(以下App Stackで記載します)の機能をご紹介したいと思いますが、その前に一度SolarWinds製品を一部ご紹介致します。

SolarWindsの製品は全部で30種類近くあります。その中でも比較的Web Consoleで可能なアプリケーションが数種類あります。

SolarWinds製品に関してはOrionと呼ばれるCore上にモジュール形式でアプリケーションが提供されます。ユーザはブラウザを介してOrionにアクセスすることでそれぞれのアプリケーションにアクセスすることが可能となります。

 

SolarWinds製品全般

左側のオレンジ部分についてはネットワーク関連の製品になります。真ん中から右のほうにかけて緑色になっている部分が今回App Stackの対象となるところになります。

(Firewall Securityに関しては現状Orionと完全に統合されていません)

  1. Server & Application Monitor 【SAM】(サーバハードウェアやアプリケーションのモニタリング)
  2. Web Performance Monitor 【WPM】(ウェブサーバのモニタリング)
  3. Storage Resource Monitor 【SRM】(ストレージのモニタリング)
  4. Virtualization Manager 【VMAN】(仮想化環境のモニタリング)

App Stackは主にサーバインフラ上で動作するアプリケーション環境などを全体的にモニタリングし、運用者に単一ビューで表示するものになります。詳細については後ほど説明致します。

 

統合化されたインフラ環境の管理

現状のインフラにおいて、物理・仮想問わず様々なインフラが存在し、その中にはアプリケーションも存在して無秩序な状態になっています。またインフラの管理者もサーバ・ストレージ・ネットワーク・仮想化とそれぞれ担当者がおり、その上アプリケーションの担当者もいます。このような状態の中で何か障害があった時にどのような形で切り分け作業を行っているでしょうか?おそらく各管理者が集まって、状況を確認しながら切り分け作業を行っていると思われます。そのようなことをしていると障害対応にも多くの時間が費やされ、運用業務だけで業務が終わってしまいます。

一般的なシステムの管理体系

 

たとえば、アプリケーション開発のプロジェクトを開始すると、インフラ担当者にプラットフォームを要求することがあるかと思います。アプリケーションの担当者はあまりハードウェアのことは詳しくないので、システムのスペックをだけをインフラの担当者に伝えてハードウェアを用意してもらいます。

その後開発プロジェクトが進みますが、アプリケーションのパフォーマンスが上がらない(もしくは遅い)といったクレームがあがりました。このままだとプロジェクトの遅延も予想されるためアプリケーションの開発者は自分達のパラメータに問題はないと思うのでインフラ側で何かおかしくないかインフラの管理者のほうで調べて欲しいと言われました。

インフラの担当者は数百台ものサーバやストレージを管理しているので、すぐにはその状況を調べるのは厳しいという回答しました。プロジェクトの進行もあることから管理者を集めて切り分けに関する打ち合わせをすることになりましたが、かなりの時間を費やすことになります。

 

問題発生時の対応(その1)

 

 

問題発生時の対応(その2)

 

無駄な打ち合わせを行わず障害が起きる前に、予兆を発見しその対策を事前に講じることを考えることで少しでも被害の軽減をすることができるかと思います。

App Stackは予兆の可視化を可能とします。

 

App Stackによるボトルネックの可視化

このようにインフラ側のどの担当者が運用端末すぐに切り分けができるような状況があります。その際にApp Stackを利用することで、一目でボトルネックになっている部分を可視化します。

では以下で画面イメージも含めてご説明致します。

 

■アプリケーションに関連するサーバ、ストレージなどの情報を瞬時に表示し、ボトルネックを可視化!!

App Stackは複雑化したアプリケーションのインフラで構成されている複数のレイヤを詳細に表示する。パフォーマンスや冗長性などの問題点の根源を明確にするためにインフラ全体を掘り下げて分析することによりインフラ環境を可視化したマップで表示します。

  1. どの運用担当者が見てボトルネック箇所がわかるように!
  2. 切り分けに時間をかけたくない!

このような悩みをお持ちの方はSAMおよびApp Stackなどが悩みを解決致します。まずはSAMの画面イメージをご覧ください。(画面は日本語表記しておりますが、製品は英語表記になります)

SAM(Server & Application Monitor)画面イメージ

Orion上部のアプリケーションタブをクリックするとSAMの画面が表示されます。Applicationサマリの中で“Troubleshooting with App Stack”という項目があり、下部に「GO TO APPSTACK」をクリックするとApp Stackの画面に遷移します。

App Stack画面イメージ

こちらがApp Stackの画面になりますが、まず左部分に環境の絞り込みを行うことができます。ステータス、表示名、アプリケーション名でフィルターをかけることができます。

右部分についてはSAMで監視できているそれぞれの項目が表示されています。それぞれの説明は以下の通りです。

  1. アプリケーション(SAMが監視できる範囲で情報が収集可能がアプリケーションを表示)
  2. トランザクション(個別のロケーションにアサインされたウェブブラウザのトランザクションを表示)
  3. ステップ(具体的なURLにナビゲートするために必要なアクションのコレクション)
  4. サーバ(SAMが監視できておるサーバハードウェア)
  5. ホスト(仮想化環境が動作しているハイパーバイザが載っているサーバ)
  6. バーチャルクラスタ(分散された複数のサーバにインストールされた仮想マシンで構築されている仮想クラスタ)
  7. バーチャルデータセンター(仮想化環境を統合的に管理しているデータセンター)
  8. バーチャルセンター(VMware環境下のvCenterに相当します)
  9. データストア(仮想マシンのデータが保存されているレポジトリ)
  10. ボリューム(論理的なドライブ WindowsなどではCドライブやDドライブに相当するところです)
  11. LUN(Logical Unit Number ストレージ内で管理されているデバイスのアドレスになります)
  12. NASボリューム(Network Attached Storageのストレージデバイス)
  13. Pools(ストレージプール)
  14. VServer(仮想ストレージサーバ 【仮想マシンではありません】)
  15. ストレージアレイ(ストレージ各社のアレイ)

右部分のそれぞれをオブジェクトに対して、初めに紹介した4つのモジュールがバックグランドで連携することにより、オブジェクトをクリックすることで選択したオブジェクトに関連するものだとがフォーカスされて見やすく表示されます。

まずはクリティカルのアプリケーションの一つにマウスを当ててみることにします。

マウスオーバーされたアプリケーション

マウスオーバーされたアプリケーションの詳細を確認すると、アプリケーションは問題あるもののサーバハードウェアは動作していることが確認できます。下部をみると平均Readのレイテンシ(遅延)が悪いような内容が見てわかると思います。

しかしながら、このサーバやストレージがどのハードなのかはここからではわかりません。そのため、このオブジェクトをクリックしてみることにします。

 

問題があるアプリケーションをクリック

左下にクリックしたアプリケーションの情報を取得しに行くプロセスが表示されます。このプロセスが終了したらこのアプリケーションに関連する情報だけフォーカスされます。

フォーカスされたオブジェクト

これらのオブジェクトを見ると、LUNのところでクリティカルの情報が表示されています。ここでLUNのクリティカルのオブジェクトをマウスオーバーします。

 

LUNをマウスオーバーした時の詳細情報

ここからわかることは対象ストレージのTotal Latencyが遅くなっていることです。この情報を見てオペレータはストレージの管理者に対してストレージのサイジングやRAID構成・iSCSI構成の見直しをお願いでき、予兆を確認することによりシステム全体の障害を防ぐことができます。(Arrayをマスクさせて頂きました)

App Stackを提供することにより、どのオペレータが管理画面を見てもボトルネックがわかることができます。それぞれのハードウェアで管理者を頼ることなくボトルネックを可視化することで障害の切り分けを迅速化し、障害における対応時間を短くすることが可能となります。

App Stackを導入して予兆を事前に発見しシステムの健全性を向上していきませんか?

ソーラーウインズの小宮です。

前回はVirtualization Manager(VMan)の機能全般とスプロール機能を紹介しましたが、今回はTime Travel機能をご紹介いたします。

 

複雑化した仮想化インフラ環境の運用

現状のITインフラ環境は仮想化、クラウド、ビッグデータ、BYODなど様々なソリューションに対応していかなければなりません。特に仮想化・クラウドの普及においてはリソースが潤沢化しすぎており、管理対象もより複雑化してきております。また複雑化が増すことにより障害切り分けにおいて、それぞれの設備の管理者などを集めて会議を行い切り分けを行うことも少なくありません。

そのため、仮想化インフラ管理においては管理者も様々な点で悩んでいらっしゃるのではないかと思われます。

  1. リソースの無駄
  2. 時間経過に伴って発生する問題
  3. ボトルネックの発生
  4. リソース・キャパシティの予測

これらの問題が管理者を悩ませる

 

前回紹介したスプロール機能はリソースの無駄を可視化して、仮想マシンの削除・仮想マシンのステータスの変更を行うことにより仮想リソース全体の有効利用を行うことができました。今回は時間経過に伴って変化する状況を可視化することにより、運用状況を詳しく把握することができるTime Travel機能をご紹介します。

 

 

■特定時間に関連する仮想サーバ、データストア、仮想マシンの状態を表示!

障害は突然起こることは少なく、何かしらの兆候があってから発生するものです。だからと言っていつもシステムを24時間ずっと人が張り付いて監視するわけにもいかないと思います。障害が起こる前か事前に情報を収集して、どのようなことが起こっているのかを把握しておけば事前に対策を打つことも可能になりますし、仮に障害になったとしても情報が収集されていれば切り分け作業も容易になるかもしれません。そのような情報を容易に検索しやすく、いつでも見ることができるようになってほしいと思いませんか?

Time Travel機能は時間を指定して、該当するクラスタに関連する仮想サーバ、データストア、仮想マシンの状態を表示します。たとえば

 

  1. 今日になって仮想マシンの動作が遅い。昨日は問題なかったので昨日の同じ時刻もしくは昨日の朝8時の仮想マシンの状態を確認したい
  2. ある部署から環境が遅くなっていないかと言われ、対象のノードをすぐに検索したい
  3. 仮想マシンを他のホストに移行したが、問題箇所を確認してみたい

 

こんなことが、Time Travel機能を利用することにより実現することができます。

時間経過に伴う問題箇所の把握が可能

 

それでは、実際の画面遷移を見ながら解説します。

VMan画面上でMapのタブをクリックすると以下のような画面が出力されます。

Time Travel機能画面


 

こちらがTime Travelですが、この画面で監視しているClusterに関連するホスト、データストア、仮想マシンの情報が表示されます。

画面左上に“Time Travel is OFF”と表示されているが、対象クラスタ(オレンジ色で囲われている部分)が多いために表示する関連項目が多くなっているから検索時間を短縮するに一つのオブジェクトを選択するまでは機能が”ON“になることはありません。

そこで”syd-hyv-clus-01”を選択し、Contextボタンを押下して対象クラスタを絞っていきます。

 

Syd-hyv-clus-01 を選択

 

クリックすると、syd-hyv-clus-01に関連するホスト、データストア、仮想マシンが表示されます。(弊社の環境上Criticalなステータスが表示されておりますが御了承下さい)


Syd-hyv-clus-01に関連する情報が表示

 

クラスタを一つに絞ると画面左上に表示されているTime Travelが機能ONとなり使えるようになります。

現状の仮想環境がこの画面で表示され、それぞれ関連する内容を表示します。

たとえばここでDataStoreに着目します。現状warning状態になっているCluster Disk2がありますが、運用者の方が2日前くらいまでは問題なく動いていたということを覚えていて現状がこの状態になっていることから3日前の状態を確認したいとします。

 

3日前の状況

 

 

こちらの画面を見てみると、データストアのウィンドウでCluster Disk2が正常に動いていたことがわかります。

このように時間指定した日時においてスナップショット的な画面イメージで仮想環境のノードの状態を確認することができます。たとえば、障害起きた際にSIベンダーに問い合わせを行う際にも現状が発生する前の状況を把握しておくことにより、的確にインフラ環境の情報を伝えることができ解析に役立てることができることがあると思います。

また検索できるデータに関しては、あらかじめ設定しておくことにより長くすることもでき短くすることもできますが、長期保存する場合はデータベース容量が大きくなりますので予め容量を確保をして設定することをおすすめいたします。

Time Travel機能を利用して仮想化環境の効率的な管理を行っていきませんか?

初めまして、ソーラーウインズの小宮と申します。

ソーラーウインズという名前をご存じでない方、もしご存じであってもネットワーク関連の監視ソフトウェアのみの方もいらっしゃると思います。

ソーラーウインズはシステム全般(ネットワーク、サーバ、ストレージ、仮想化、その他アプリケーションなど)を監視可能な製品が揃っております。

今回はその中でも仮想化の管理・監視が可能なVirtualization Manager(略してVMan)をご紹介いたします。

 

  • VManはどのようなソフトウェアなのか?
  1. ハイパーバイザーおよび仮想マシンのパフォーマンスおよびシステムの稼働状況をモニタリング
  2. システムに影響を与えるような事象が発生した場合、問題を検出・診断し、早急に対応するための情報を可視化

 

Sprawl01.png 

Virtualization Manageの表示画面

 

sprawl02.png

VManにて仮想マシン状態を表示

 

  • VManを導入するが何が良いのか?
  1. マルチベンダ対応(VMware ESXi/ Microsoft Hyper-V)
  2. 将来予測、障害早期検知、容量ボトルネックのトラブルシューティングをダッシュボードで可視化
  3. VMware ESXi / Hyper-V の統合的なキャパシティプランニング
  4. サーバおよびアプリケーションの監視可能な【Server & Application Monitor(SAM)(※1)】とネットワークの監視可能な【Network Performance Monitor(NPM)(※2)】との統合により物理および仮想環境含めた統合的な監視環境の提供が可能
  5. 無秩序に作成された仮想マシン乱立した仮想インフラの管理
  6. パフォーマンスモニタリング
  7. チャージバック、ショーバックの自動化
  8. 仮想化設定の管理


もちろん仮想化ソフトウェアの中で同様なソフトウェアを提供していることもありますが、ソーラーウインズは物理および仮想環境の統合的な管理および監視を行うソリューションをご提供いたします。

今回は5の無秩序になっている仮想環境の管理について、VManが提供する機能をご紹介いたします。

 

  • 無秩序に作成された仮想マシンのインフラの管理

必要な時に潤沢なリソースが自由に使える、プライベートクラウド……。

そのような話は夢にしかすぎません。社内で仮想化されたリソースプールを持つと、企業のユーザー部門、特にシステム開発部門は、仮想化環境の管理者にリソースの使用要求を「気軽に」出してくるようになります。

次々と来る要求に対して、ユーザーの要求に答えていくと仮想マシンが増えていることはありませんか?

作成した仮想マシンが有効的にリソースが使われているかどうかわからず、もしかするとゾンビ化した仮想マシンが存在しているかもしれず、そのような仮想マシンの存在を知らずに無駄にリソースを存在しているかもしれません。

  sprawl03.png

仮想マシンを作成依頼を受けていった結果・・・

 

sprawl04.png 

使えきれず過剰なリソースを与えたり、使われていない仮想マシンいたりする・・・

  1. 過剰にCPU/メモリリソースを割与えられた仮想マシン
  2. 起動したままIdle(待機)状態の仮想マシン
  3. 起動もされず放置されている仮想マシン
  4. バックアップ用にスナップショットはとっているけれども知らない間に容量が逼迫

いつのまにかこんな状況になっているものが数多く存在しているかもしれません。

このような状態のままでは、キャパシティ・プラニングも適切にできず、ひいては過剰な設備投資を引き起こしかねません。

 

■今ある仮想マシンの適切なプロセッサー・メモリー割り当て量を提示!

VManの仮想化スプロール機能は、その名の通り、無秩序に広がる仮想化サーバー群を掌握し、効率的に管理するための機能です。たとえば……

  1. 各仮想マシン使用率に対し、適切なCPU数、メモリー量を提案し、その場で変更管理
  2. XX日間Idle状態の仮想マシンは、電源オフ
  3. XX日以上利用していない仮想マシンは、その場で削除

こんなことが、SolarWindsのWebコンソール経由で実行できます。(30日の仮想マシン未起動,一週間の仮想マシン待機状態)

 

  sprawl05.png

vCenter, SystemCenterと連携して仮想マシンの状態を変更および削除が可能

運用者は自らログなどを確認することもなく、VManで自動的にデータを蓄積し仮想マシンの状態確認(ヘルスチェック)を行います。こちらの機能に関してはVManを購入することで標準的に利用可能な機能となっております。この機能を利用することにより、システム増強前に現状のリソースを確認してはいかがでしょうか?

弊社ホームページ(http://www.solarwinds.com/jp/)より30日無償版がダウンロード可能です。気軽にお試し下さい。

 

(※1)ソーラーウインズが提供するサーバおよびアプリケーションを監視するソフトウェア

(※2)ソーラーウインズが提供するネットワークトラフィックおよびネットワークノードを監視するソフトウェア

ソーラーウインズの製品紹介リーフレットの掲載を開始しました。

「システム管理ツールというけど、具体的に何ができるの?」というご質問にお答えするため、課題とソリューションによりフォーカスした内容となっております。

 

とはいえ、いまご紹介できている資料は、20種類以上ある製品のごく一部、限られた機能だけです。 まだお伝えできていない弊社製品の魅力は、たくさんあります。

これからも資料をどんどん増やし、またブラッシュアップしていきますので、ご期待ください!

 

また、「こんなことはできないの?」というご質問は、Thwack技術コミュニティの質問フォームからいただければ、タイムリーにご回答いたします。ご活用ください。

 

 

ソーラーウインズ 機能紹介 総合版

https://thwack.solarwinds.com/docs/DOC-177781

 

SolarWinds uses cookies on its websites to make your online experience easier and better. By using our website, you consent to our use of cookies. For more information on cookies, see our cookie policy.