Failover Engine (FoE)について (その1)

Version 3

    Are you afraid of the dark?

     

    以下は、上のURLのthwack記事を、簡潔に和訳したものです。

     

     

    Orionサーバが何らかの障害で機能しなくなった場合を想定してみよう。

    FoEAdditional Pollin Engine(APE)や、Enterprise Orion Console (EOC)を含むOrion全製品に対し、機器の障害から運用を守るフェイルオーバー機能として用意されている。

    image

     

    FoEマネージャを、Orionサーバ上、もしくは管理者端末にロードし、フェイルオーバーの設定や現状の導入ステータスの確認が可能。

    FoE Summary

     

    FoEは、プライマリー/セカンダリーサーバのIISサービスなど、全てのOrionサービスをモニタリングする。

    Preferense設定では、それぞれのサービスに対してフェイルオーバーの挙動を定義することができる。これにより、単純に全てでフェイルオーバーを働かせるだけはでなく、例えば、Orion Information Serviceが停止した場合、管理者が自身でサービスを確認し、状況に応じてフェイルオーバーを実施させることもできる。

    FoE App Service Actions

     

    FoEは、単にサービスをモニタリングするだけでなく、OSの状況などもFoEの対象としてモニタリングし、アクションを定義することができる。

    例えば、プライマリサーバのHDD空き容量が15%以下、10%以下のそれぞれで管理者にメール通知し、5%以下になればフェイルオーバーを発動させるようなことができる。

    FoE App Rules

     

    FoEには、Orion製品が持つアラートシステムとは別に、FoE特有のモニタリング内容に対する独立したアラートエンジンを持っている。

    FoE Alerts

     

    FoEの展開は、以下の形式がサポートされている。

     物理サーバから物理サーバ

     物理サーバから仮想サーバ

     仮想サーバから仮想サーバ

    Orionサーバを導入・セットアップ完了後、FoEは、レジストリやファイルシステムパラメータなどのフェイルオーバーに必須の設定情報をセカンダリーサーバ上に複製する。この初期設定が完了すると、リアルタイム・ファイル/レジストリ変更フィルタ機能を通じて、必要なデータがセカンダリーサーバに複製される。これにより、プライマリサーバとセカンダリーサーバは常に同期が取れるようになっている。

    FoE Data Replication Filters

     

    高可用性(High Availability)タイプのフェイルオーバーのプロセスを見てみよう。

    プライマリサーバとセカンダリーサーバは、同じサブネット上に配置され、同じIPアドレスを共有する。本来であれば、複数の同一IPアドレスが同じサブネット上に存在することはあり得ないが、FoEのパケットフィルター機能により、セカンダリーサーバのNICではパケットの送受信行われないようになっている。

    また、もう1つの別のNICを通じて、プライマリー/セカンダリーサーバはハートビートが取られ、リアルタイムでの同期が図られている。

    image

     

    フェイルオーバーの条件が満たされた場合、

    ・もしプライマリーサーバ上で、まだ何らかのサービスが走っていれば、シャットダウンされる。

    ・セカンダリーサーバ上で、NICのパケットフィルタが解除され、Orionサービスの開始と共にアクティブサーバとなる。

    ・ダウン状態となったプライマリーサーバはセカンダリーサーバとなり、未だOSとして動作している(Online)状態の場合、パケットフィルターが機能する。

     

    ダウンタイムは、セカンダリーサーバのフェイルオーバープロセスの開始と、各サービス開始の時間のみとなる。

    また、高可用性(High Availability)タイプのフェイルオーバーの大きな利点として、IPアドレスが変化しない為に、SyslogSNMP TrapNetFlowの監視において、デバイス側の設定を全く変更する必要がない。



    [関連情報]

    Failover Engine (FoE)について (その2) + Q&A