Linux系统死机的软硬件问题分析软件编
Linux系统死机的软硬件问题分析 - 软件编程/OS
系统出现死机,一般分为两种情况:一是硬件问题;二是软件问题。
一、硬件问题
可以考虑分析以下几点:
1、不要超频CPU,如果已经超频的先回复到原来的频率
虽然平时运行没有问题,但可能在高负载的使用中就会出现不可预料的故障了。特别是Linux系统在某些应用上,是可以把硬件的性能发挥到极限的,但这样的硬件运行Windows可能是没有问题的。
2、确认电源供电充足
必须确保在高负载的状态下,电源可以满足负载。
3、使用memtest86检查内存状态
4、恢复BIOS到默认状态
对于服务器,可以使用自带的监测工具进行测试,也是一个不错的排错方法。
二、软件问题
如果已经基本排除硬件问题,那我们就必须考虑从软件上去获得死机状态的系统信息了。
1、运气足够好的话,系统死机不一定是完全死掉(此时键盘可能还能响应),那我们就可以使用Sysrq大法。
前提是我们必须先打开sysrq功能:
#echo 1 > /proc/sys/kernel/sysrq
#setterm-blank
这样,当系统出现问题的时候,我们可以使用:
引用
Alt+Sysrq-T 获得进程系统堆栈信息
Alt+Sysrq-M 获得内存分配信息
Alt+Sysrq-W 获得当前寄存器信息
更多的热键可以参考系统上的/usr/src/linux/Documentaion/t
其中,setterm -blank可以关闭字符下定时黑屏保护,方便记录屏幕信息。
2、为了让屏幕显示更多的内核调试信息,可以修改控制台的显示模式为80x25,在/boot/grub/t中对应的kernel一行,增加vga=0x305,如:
引用
kernel /boot/vmlinuz-2.4..30AXsmp ro root=/LABEL=/1 vga=0x305
3、万一键盘也不幸死掉了,那我们只能采用串口方式,把系统信息发送到另一台系统上,方法:
修改/boot/grub/t文件,在kernel一行增加核心参数console=ttyS0 console=tty1,如:
引用
kernel /boot/grub/vmlinuz-2.4..30AXsmp ro root=/LABEL=/1 console=ttyS0 console=tty1
然后,修改/etc/sysconfig/syslog,加入klogd选项-c 7,如:
引用
KLOGD_OPTIONS=-x -c 7
重启服务器;进行测试:
1)使用串口直连线连接客户机和服务器,在客户机上运行:
cat /dev/ttyS0
服务器上运行:
echo hi > /dev/ttyS0
如果客户机有hi输出即可。
2)服务器上运行:
echo w > /proc/sysrq-trigger
看看客户机上是否有相应的内核信息输出
3)服务器上运行:
modprobe loop
看看客户机上是否有相应的内核信息输出
如果测试都通过的话,那么在客户机上运行:
cat /dev/ttyS0 | tee /tmp/result
当死机出现的时候,我们就可以从客户机上看到需要的内核信息了(查看/tmp/result)。
三、总结
一般造成Linux系统死机的原因有:
系统硬件问题(SCSI卡,主板,RAID卡,HBA卡,卡,硬盘等)
外围硬件问题(络等)
软件问题(系统、应用软件)
驱动bug(找新的驱动)
核心系统bug(到LKML看看,或更换核心再试)
系统设置(恢复到缺省状态,关闭防火墙等)
抛丸机价格火锅加盟钢坝生产厂家-
老冯精彩剪辑这戈枪法强的跟开了G1般iyiou.com
老冯精彩剪辑这戈枪法强的跟开了G1般黑科技:这样购1秊省几千 吃鸡老司机全心推荐,仕装礼包免费领取 ...[详细]
-
第1页阅读器发布V24iyiou.com
第1页:阅读器发布V2.4日前,第3方阅读器的争取之战异常剧烈。除占据前列的阅读器嗬UC阅读器之外,傲游、Opera等...[详细]
-
现在娜姐更新动态表示明天1早烩为跶家带来iyiou.com
周3的升级盅,Windows10PC版用户并没佑享受更新,反而被用户抢先,郈者的版本号椰刷捯了Build15051的新高。对此,In...[详细]
-
提升机场安全运营助力智慧机场建设
提升机场安全运营 助力智慧机场建设随着“十三五”期间国家对机场建设的投资力度不断加大,中国正迎来史无...[详细]
-
准备工作开博尔M2u盘电脑iyiou.com
开博尔盒子一直很受大家欢迎,友们非常关心开博尔M2如何安装第三方软件。下面就为大家介绍下简单修心:世界上...[详细]
-
删除win7病毒文件夹的步骤iyiou.com
现如今,络上的木马病毒很容易入侵捯我们的电脑上,不幸盅了木马已郈,都烩在系统磁盘盅笙成1戈 SystemVolumeIn...[详细]