上周,机器反复出现原因不明的自动reboot。而且都是出在编译代码的时候。 先是怀疑软件问题,但是我的机器上从来不装乱七八糟的程序,唯一可能有关系的就是TrueCrypt,但是编译时使用的分区并不是加密盘。查了一遍rootkit,也没有。 于是怀疑硬件问题。发现把内存换一个插槽后,或者只是用一根内存时,虽然还会reboot,但是概率要小得多。这就更坚定了我的怀疑。当我把几乎所有硬件都换了,把硬盘插到另一个完全一样的机器上时,问题仍然存在。这就说明,要么是硬盘问题,要么还是软件问题。当然,这种情况下软件问题的可能性大得多。 我在另一机器上新装了操作系统,让它自动编译测试了一上午,没事。下午,给那个机器装了TrueCrypt,再自动编译测试,也没事。最后,我在编译的同时,对TrueCrypt的虚拟盘进行读写,终于reboot了。而且反复测试多次,都可以重现。看样子触发条件就是对非虚拟盘和虚拟盘同时进行大量读写操作。
http://hi.baidu.com/tombkeeper - 选录
总算搞清楚机器反复reboot的原因了
2007-11-30链接