位置:海鸟网 > IT > linux/Unix >

linux服务器在运行210天左右宕机

错新网讯   最近几天,一批linux线上的服务器接连宕机,当时以为是硬件问题,重启机器之后进入系统查看日志,只发现几条报错:

dmesg | grep -i error
ERST: Error Record Serialization Table (ERST) support is initialized.
ACPI Error: No handler for Region [IPMI] (ffff88081cd55420) [IPMI] (20090903/evregion-319)
ACPI Error: Region IPMI(7) has no handler (20090903/exfldio-295)
ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._GHL] (Node ffff88101c853a38), AE_NOT_EXIST
ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMC] (Node ffff88101c853a88), AE_NOT_EXIST

上网根据错误查了些资料,大多都说是硬件驱动问题,但是根据我的经验,驱动问题并不会在这种情况下发生,而且日志错误也会比较详细,最重要的一点是多台机器都是在系统运行了213天没有重启的情况下发生的。

后来上linux论坛查阅了相关资料,发现Linux Kernel 2.6.28 有一个BUG,自系统运行了208.5天的时候,会出现自行重启或者其他意外的故障:

https://access.redhat.com/knowledge/solutions/68466

对此,最好的解决方法就是更新系统内核

yum install kernel

然后重启系统