[メール・サーバー障害編]復旧作業失敗!残された道はバックアップ・データのリストア:ITpro(情報元のブックマーク数)

障害対応を実際やってみると、マニュアルどおりに行かずに、色々試行錯誤をしながら対応することも多いですね。でも納得いかなくても、報告・連絡・相談、そして判断を仰ぐことは必要ですね。

障害対応していると報告・連絡がおろそかになるので、ここは連絡担当というのを付けないといけないですね。

障害対応の現場では,多くの要素を基に柔軟かつ迅速な判断が求められることは前述したが,これはその一例だろう。障害の内容がシステムの提供するサービスに影響を与えるものである場合,障害原因の究明とその対処より先に,暫定的な方法でサービスへの影響を回避しなければならない場合が多い。障害対応において,様々な状況下でそれぞれどのように対応すべきか,という判断は非常に重要であり,必ず運用担当チームの責任者あるいはそれに代わるあらかじめ定められた役割の人間の判断を仰がねばならない。これを怠ったがために,後々重大な問題に発展した事例を筆者はいくつも見てきた。

 今回の障害では,運用担当チームの責任者に連絡が取れたため迅速に正しい判断をあおぐことが出来たが,何らかの理由により運用責任者あるいはそれに代わる人間に連絡がとれない場合もあるだろう。そのようなときのために,判断を下すことができる人間を複数定めておき,連絡の順位付けを行なった緊急時の連絡フローをまとめておく必要がある。

[メール・サーバー障害編]復旧作業失敗!残された道はバックアップ・データのリストア | 日経 xTECH(クロステック)

screenshot