サーバーが急に止まった

問い合わせ

サーバーに急に止まった。

「L2/L3 Cache Error」とかいうメッセージが表示されている。

対応

メッセージの内容から、以前の RAID コントローラーのファームウェアの問題かと思ったのだが、実際は違っていた。

現地に行って、とりあえず画面の「続けるなら ‘X’」の指示に従い、X を押し、再起動する。

するとちゃんと起動した。

そのとき、サーバーの LED を確認したが、オレンジの△が点灯していないので、HDD などに異常はなさそう。


次にサーバーのログなどを確認するが、いまいち原因がわからない。

HDD の何かのエラーが出ているのだが、そのエラー内容の意味が分からないし、そもそも HDD の読み取りエラーなどのエラー数は 0 なので、本当にエラーなのかもわからない。

HDD 関係以外のログも調べたが、SQL サーバーのエラーが出ているが、これがサーバーを止めた直接の原因かもわからない。

結局何もかもわからないばかりで、様子を見てもらうことにした。


ちなみに、RAID コントローラーのファームウェアは最新であり、「L2/L3 Cache Error」は修正されているはず。


さらにわからないのは、同じ日に別の学校でも同様の症状でサーバーが止まったこと。

根拠はないが寒いからとしか思えない。