ICTSC8競技中に発生したトラブルの技術的な観点での解説 | ICTSC tech-blog

(情報元のブックマーク数

電源低下とかリアルインシデント・・・・

電気通信大学での準備期間、及び本番1日目までは、上記の6台体制で運用を行っており、特に問題なく動作していました。 しかし、2日目の10時過ぎごろに、突然m4の1台(m4-02)が再起動しました。直接的な原因は最終的に分かりませんでしたが、一度起動した後も何度か再起動を繰り返していたため、電源ユニットの不調を疑い、起動させていなかったm4から電源ユニットの交換を行いました。 その後は正常に起動したのですが、その後ucs3台が1台ずつ、30秒ほどのスパンを開けて再起動している事に気づきました。 この時点でマシン固有の、ハードウェア起因な障害である可能性が低いのではないかという仮説が立ち、電力的な障害の可能性が浮上しました。
会場となった電気通信大学では、一部屋に独立した系統が3つあり、事前にサーバやネットワーク機器が利用出来る電気容量を計算した上で運用していました。 上記の通り、本番1日目までは正常に動作していたので、特に問題ないという認識でしたが、トラブルが発生した後に計測してみると、驚くことに92Vほどしか出力されていませんでした。

ICTSC8競技中に発生したトラブルの技術的な観点での解説 | ICTSC tech-blog

screenshot