昨日起きたAmazon EC2の障害について | twk @ ふらっと(情報元のブックマーク数)

EC2の障害の記録。こういうのがあることを知っておくことも大切。

・AM11時頃、EC2 EBSインスタンスサーバーへのhttp接続異常について外部監視プログラムから通知あり
・自分でhttpで接続するが応答無し
sshにて該当インスタンスに接続を試みるが、応答無し
・同一ゾーンに置いてある他のサーバーには接続成功
・外部からpingを行うが応答無し
・他のEC2インスタンスから内部ipでpingを行うが応答無し
ダッシュボードからインスタンスの状況を確認するがrunningになっており、特に異常はなし
・EC2の障害情報を見るが特に掲載なし

Loading...

障害は起こりうる、バックアップとかは必須だな。本当に。

まとめ

・EC2インスタンスのネットワーク障害は突然起こりうる。経験者もそれなりにいる。
・rebootまたは、stop後startで復旧する場合がある
・ただしstopにはかなり時間が掛かる
・自動バックアップスクリプトを動かしておけばその時点でのデータにて
すぐに復旧することはできたが、データロスが発生するので、それはそれで好ましくない。
・rebootしてくれないインスタンスについて、プレミアムサポートがあればメールで依頼して30分くらいで復旧できる。
・フォーラムにインスタンスid等書いて復旧してくれる場合もあるが、時間が掛かる可能性あり。

Loading...

screenshot