ソーラーウインズの小宮です。

前回はVirtualization Manager(VMan)の機能全般とスプロール機能を紹介しましたが、今回はTime Travel機能をご紹介いたします。

 

複雑化した仮想化インフラ環境の運用

現状のITインフラ環境は仮想化、クラウド、ビッグデータ、BYODなど様々なソリューションに対応していかなければなりません。特に仮想化・クラウドの普及においてはリソースが潤沢化しすぎており、管理対象もより複雑化してきております。また複雑化が増すことにより障害切り分けにおいて、それぞれの設備の管理者などを集めて会議を行い切り分けを行うことも少なくありません。

そのため、仮想化インフラ管理においては管理者も様々な点で悩んでいらっしゃるのではないかと思われます。

  1. リソースの無駄
  2. 時間経過に伴って発生する問題
  3. ボトルネックの発生
  4. リソース・キャパシティの予測

これらの問題が管理者を悩ませる

 

前回紹介したスプロール機能はリソースの無駄を可視化して、仮想マシンの削除・仮想マシンのステータスの変更を行うことにより仮想リソース全体の有効利用を行うことができました。今回は時間経過に伴って変化する状況を可視化することにより、運用状況を詳しく把握することができるTime Travel機能をご紹介します。

 

 

■特定時間に関連する仮想サーバ、データストア、仮想マシンの状態を表示!

障害は突然起こることは少なく、何かしらの兆候があってから発生するものです。だからと言っていつもシステムを24時間ずっと人が張り付いて監視するわけにもいかないと思います。障害が起こる前か事前に情報を収集して、どのようなことが起こっているのかを把握しておけば事前に対策を打つことも可能になりますし、仮に障害になったとしても情報が収集されていれば切り分け作業も容易になるかもしれません。そのような情報を容易に検索しやすく、いつでも見ることができるようになってほしいと思いませんか?

Time Travel機能は時間を指定して、該当するクラスタに関連する仮想サーバ、データストア、仮想マシンの状態を表示します。たとえば

 

  1. 今日になって仮想マシンの動作が遅い。昨日は問題なかったので昨日の同じ時刻もしくは昨日の朝8時の仮想マシンの状態を確認したい
  2. ある部署から環境が遅くなっていないかと言われ、対象のノードをすぐに検索したい
  3. 仮想マシンを他のホストに移行したが、問題箇所を確認してみたい

 

こんなことが、Time Travel機能を利用することにより実現することができます。

時間経過に伴う問題箇所の把握が可能

 

それでは、実際の画面遷移を見ながら解説します。

VMan画面上でMapのタブをクリックすると以下のような画面が出力されます。

Time Travel機能画面


 

こちらがTime Travelですが、この画面で監視しているClusterに関連するホスト、データストア、仮想マシンの情報が表示されます。

画面左上に“Time Travel is OFF”と表示されているが、対象クラスタ(オレンジ色で囲われている部分)が多いために表示する関連項目が多くなっているから検索時間を短縮するに一つのオブジェクトを選択するまでは機能が”ON“になることはありません。

そこで”syd-hyv-clus-01”を選択し、Contextボタンを押下して対象クラスタを絞っていきます。

 

Syd-hyv-clus-01 を選択

 

クリックすると、syd-hyv-clus-01に関連するホスト、データストア、仮想マシンが表示されます。(弊社の環境上Criticalなステータスが表示されておりますが御了承下さい)


Syd-hyv-clus-01に関連する情報が表示

 

クラスタを一つに絞ると画面左上に表示されているTime Travelが機能ONとなり使えるようになります。

現状の仮想環境がこの画面で表示され、それぞれ関連する内容を表示します。

たとえばここでDataStoreに着目します。現状warning状態になっているCluster Disk2がありますが、運用者の方が2日前くらいまでは問題なく動いていたということを覚えていて現状がこの状態になっていることから3日前の状態を確認したいとします。

 

3日前の状況

 

 

こちらの画面を見てみると、データストアのウィンドウでCluster Disk2が正常に動いていたことがわかります。

このように時間指定した日時においてスナップショット的な画面イメージで仮想環境のノードの状態を確認することができます。たとえば、障害起きた際にSIベンダーに問い合わせを行う際にも現状が発生する前の状況を把握しておくことにより、的確にインフラ環境の情報を伝えることができ解析に役立てることができることがあると思います。

また検索できるデータに関しては、あらかじめ設定しておくことにより長くすることもでき短くすることもできますが、長期保存する場合はデータベース容量が大きくなりますので予め容量を確保をして設定することをおすすめいたします。

Time Travel機能を利用して仮想化環境の効率的な管理を行っていきませんか?