先日社内でネットワーク障害が発生し、一部の業務ができない事態となった。これまでもネットワーク障害が発生したことはあったが、丸1日以上通信断が発生した障害は今回が初めてだった。なので、この障害を経験して「事前にこういうことをしたほうがよかった」と思ったことをまとめる。
設置したネットワーク機器の写真を保管する
障害が発生したのは遠方の拠点だったので、実際に機器の状態を確認したのは現地の担当者だった。情シス部門で作成したネットワーク構成図には機器の型式が書いてあったが、口頭で型式を伝えてもあまり理解してもらえなかった。機器の写真を保管していれば「何色の機器がどんな状態か」「どこにつながっているか」ということが伝わりやすかったように思う。
私は正直、型式さえ分かればネットで調べればどんな機器か分かるのでわざわざ写真を保管する必要はないと思っていた。しかし、ここで盲点だったのは機器の普段のランプ点灯状態が分からないことだった。
現地の担当者から「○○のランプが光っている」と言われても、すぐにはそれが正常なのか異常なのかが判断できなかった。正常に動作している状態の写真があれば「どのランプが光っていると異常か」がすぐに理解できていたと思う。
ネットワーク機器の情報を共有する
私は、障害が発生した拠点ではバックアップ回線は用意されていないと思っていた。それはネットワーク構成図を見たときにメイン回線しか書かれていなかったからだが、実際には故障した機器にはモバイル端末を利用してバックアップ回線に接続する設定が行われていた。*1この設定は情シス部門内であまり情報共有されておらず、一部の担当者しか知らない状態だった。
私はバックアップ回線が用意されていないことを前提に現地担当者やプロバイダに話をしてしまったので、ネットワーク機器の情報がきちんと共有されていればもう少し対応が早かったかもしれないと思った。*2
おわりに
障害が起きないに越したことはないが、障害が発生したときに備えてあらかじめ機器の情報を保管・共有することは大切だと思った。そのあたりがまだまだ甘かったと認識させられた。