以下は、上のURLのthwack記事を、簡潔に和訳したものです。
Orionサーバが何らかの障害で機能しなくなった場合を想定してみよう。
FoEはAdditional Pollin Engine(APE)や、Enterprise Orion Console (EOC)を含むOrion全製品に対し、機器の障害から運用を守るフェイルオーバー機能として用意されている。
FoEマネージャを、Orionサーバ上、もしくは管理者端末にロードし、フェイルオーバーの設定や現状の導入ステータスの確認が可能。
FoEは、プライマリー/セカンダリーサーバのIISサービスなど、全てのOrionサービスをモニタリングする。
Preferense設定では、それぞれのサービスに対してフェイルオーバーの挙動を定義することができる。これにより、単純に全てでフェイルオーバーを働かせるだけはでなく、例えば、Orion Information Serviceが停止した場合、管理者が自身でサービスを確認し、状況に応じてフェイルオーバーを実施させることもできる。
FoEは、単にサービスをモニタリングするだけでなく、OSの状況などもFoEの対象としてモニタリングし、アクションを定義することができる。
例えば、プライマリサーバのHDD空き容量が15%以下、10%以下のそれぞれで管理者にメール通知し、5%以下になればフェイルオーバーを発動させるようなことができる。
FoEには、Orion製品が持つアラートシステムとは別に、FoE特有のモニタリング内容に対する独立したアラートエンジンを持っている。
FoEの展開は、以下の形式がサポートされている。
物理サーバから物理サーバ
物理サーバから仮想サーバ
仮想サーバから仮想サーバ
Orionサーバを導入・セットアップ完了後、FoEは、レジストリやファイルシステムパラメータなどのフェイルオーバーに必須の設定情報をセカンダリーサーバ上に複製する。この初期設定が完了すると、リアルタイム・ファイル/レジストリ変更フィルタ機能を通じて、必要なデータがセカンダリーサーバに複製される。これにより、プライマリサーバとセカンダリーサーバは常に同期が取れるようになっている。
高可用性(High Availability)タイプのフェイルオーバーのプロセスを見てみよう。
プライマリサーバとセカンダリーサーバは、同じサブネット上に配置され、同じIPアドレスを共有する。本来であれば、複数の同一IPアドレスが同じサブネット上に存在することはあり得ないが、FoEのパケットフィルター機能により、セカンダリーサーバのNICではパケットの送受信行われないようになっている。
また、もう1つの別のNICを通じて、プライマリー/セカンダリーサーバはハートビートが取られ、リアルタイムでの同期が図られている。
フェイルオーバーの条件が満たされた場合、
・もしプライマリーサーバ上で、まだ何らかのサービスが走っていれば、シャットダウンされる。
・セカンダリーサーバ上で、NICのパケットフィルタが解除され、Orionサービスの開始と共にアクティブサーバとなる。
・ダウン状態となったプライマリーサーバはセカンダリーサーバとなり、未だOSとして動作している(Online)状態の場合、パケットフィルターが機能する。
ダウンタイムは、セカンダリーサーバのフェイルオーバープロセスの開始と、各サービス開始の時間のみとなる。
また、高可用性(High Availability)タイプのフェイルオーバーの大きな利点として、IPアドレスが変化しない為に、Syslog、SNMP Trap、NetFlowの監視において、デバイス側の設定を全く変更する必要がない。