ネットワークホストのステータスと到達可能性について
導入に関して
あなたはユーザーに本当に「インターネットがダウンした」と伝えますが、インターネットがダウンしたことを確認したいのであれば、テクニカルサポートに問い合わせてください。また、技術者として、誰も電源コードを抜いた状態では、インターネットから引き離さなかったと確信します。ユーザー環境とインターネットの間で、どこが障害が発生しているのか確認しなければなりません。
たとえば、障害が発生した場合、あなたは障害の原因・問題について調査します。考えられる原因としては、ユーザによってコンピュータの電源は切られることがあります。また、ユーザが使用するコンピュータによっては、ネットワークケーブルを抜く事も考えられます。さらに、組織内のコアルータが本来の挙動に反して動いたことも考えられます。障害の原因が、たとえどんな些細な事であってもインターネットはダウンしておらずたまたまアクセスできなかった事も考えられます。
Nagiosは、あなたがモニターしているホストがダウンしたのか、あるいは、ネットワークに接続疎通出来ていないかを決定することができます。これらは異なるステータスで、迅速にネットワーク問題の原因を発見することができます。到達可能性がこれらの2つのステータスを区別するために機能する方法は、下記に記載してあります。
例のネットワーク
下記サンプルのネットワーク図を見てください。この例には、あなたが描かれるすべてのホスト(サーバー、ルータ、スイッチ、その他)をモニターしていると仮定することをします。また、Nagiosはインストールされて、Nagiosホストで稼働しています。
親子関係
Nagiosが、モニターされているホストのためにDOWNとUNREACHABLEかを区別することができるためにあなたはそれらのホストがどのように互いに接続しているか、Nagiosに問い合わせる必要があります。またNagiosに問い合わせるためにに、データパケットがNagiosデーモンから個々のホストまでの経路をたどります。各々のスイッチ(ルータ)、そして、パケットが通過するサーバーは、「ホップ」と考えられてあなたがNagios.で親子のホスト関係を定めることを義務づけます。親子のホスト関係がNagiosの視点から見えるネットワークは下記にあります。
あなたが親子関係がモニターされているホストの関係がどのように把握しているかを Nagios上でどのように反映するように設定をおこなっているかは、ホスト定義の「parents」にて設定することができます。親子関係によるホスト定義のサンプルネットワークの設定が、下記に記載してあります。
define host{ host_name Nagios ; <-- The local host has no parent - it is the topmost host } define host{ host_name Switch1 parents Nagios } define host{ host_name Web parents Switch1 } define host{ host_name FTP parents Switch1 } define host{ host_name Router1 parents Switch1 } define host{ host_name Switch2 parents Router1 } define host{ host_name Wkstn1 parents Switch2 } define host{ host_name HPLJ2605 parents Switch2 } define host{ host_name Router2 parents Router1 } define host{ host_name somewebsite.com parents Router2 }
運用時のネットワークの到達可能性理論
Nagiosによって構成されたホスト/親子関係で、問題が発生した場合について確認しましょう。仮で、WebとRouter1がダウンしたと考えてください。
ホストがステータスがUPからDOWNに変化があった際に、Nagiosのホストの到達可能性理論が反応します。到達可能性論理は、ホストのステータスに変化があった場合、そのホストに属した親、子のホストに対して平行して、チェックを開始します。 また、ステータスに変化があった場合には、Nagiosから即座に現状のネットワーク状態の通知があります。
この例では、Nagiosはそれぞれのホストへの経路がふさがれていないので、 WebとRouter1の両ホストのステータスがDOWNであると確定しています。
Nagios側では、Router1配下にあるホストからのホスト状態を受け取ることができないので Router1の下のすべてのホスト全てに「UNREACHABLE(未確認)」な状態と確定しています。それらのホスト自体は、UPしているかもしれません、あるいは、DOWNしているかもしれませんが Nagiosからは、Router1配下のホスト状態を受け取ることができないので、Nagiosは、ホストダウンではなく「UNREACHABLE(未確認)」な状態として確定させます。
UNREACHABLE(未確認)なステータスの通知について
デフォルトでは、、Nagiosでは、ホストダウンと未確認ホストのステータスについては通知します。管理者として、未確認ホストであるホストについて通知をしたくない場合もあります。ネットワーク構造を熟知している場合や、Nagiosがあなたのルータ/ファイアウォールより下の階層に存在する状態で、ステータスの変化による通知を行うのであれば、ステータスが変化した際は対象のホストまで到達できないことも分かります。
あなたがネットワーク停止期間の間に未確認ホストの通知を行わないのであれば コンタクト定義にて、 ホスト定義の、 host_notification_optionsにて(u)オプションを外すことで通知しないようにすることができます。