障害記録 UPS 2012/09/28

Posted on 2012/09/28(Fri) 22:40 in technical

本日のアクセス障害に関する障害記録。

  • 11:02 ESXi動作マシンの電源故障により、収容仮想マシンがダウン(時間はログから推定)。仮想化されていたルータのダウンにより、全外向きサービスの不通となる
  • 19:45 当初原因不明であったため、同マシンの電源を投入したところ、電力供給ライン上のUPSが短絡検出したことで当該UPSの電力供給が停止。これにより、UPS収容装置の全断が発生
  • 19:50 故障電源を予備電源と入れ替えて再度起動
  • 20:07 各監視アラートの対処を完了

今後の対応と対策

  • どうしよっかー...

冷静にログ追ったら断時間が8時間5分とか、年間で言うと0.1%分の稼働率が吹っ飛んだことに...。

まぁメンテナンス入れたらもっと吹っ飛んでますけど。