気象情報配信システムのダウン、引き金はハード故障 | 情報・通信 | nikkei BPnet 〈日経BPネット〉(情報元のブックマーク数)

SUNのハードウエアを使ってたそうだが、CPUボード故障による障害長期化とのこと。

ホットスタンバイで2重化をしていたが、予備系に切り替わらなかったそうです。障害訓練は難しいとは思いますが、、、思いも寄らない障害ってことかな。
こういう障害訓練って、CPUボードを抜いたり、メモリを抜いたりするのかなぁ??(銀行ならするだろうな)

気象庁から報道機関などに気象データを配信する「電文形式データ配信システム」が2009年3月9日午前3時10分にダウンしたのは、ハードウエアの故障が引き金となっていたことが分かった(関連記事)。

 電文形式データ配信システムは、「サン・マイクロシステムズ製のUNIXサーバーなどで動作している」(気象業務支援センター)。このサーバー内部のCPUボードが故障した。

 電文形式データ配信システムは、本番系と予備系からなる「ホットスタンバイ方式」の二重化構成を採用していた。CPUボードの故障は本番系サーバーで発生した。本来ならすぐに予備系サーバーが起動するはずだったが、そうならなかった。予備系サーバーが、起動に必要な本番系からの引き継ぎ情報を正しく読み込めなかった。

 引き継ぎ情報は、本番系と予備系のどちらからもアクセス可能な共用ディスクに格納していた。共用ディスクに関連するハードもしくはソフトの不具合が重なったとみられる。

http://www.nikkeibp.co.jp/it/article/NEWS/20090309/326222/

screenshot