联想Think Server TS540/440蓝屏故障处理

一、基本情况

服务器故障问题,通过网管员和技术员了解到基本情况:
1.服务器是联想Think Server TS540/440
2.操作系统是Windows Server 2008R2
3.系统登录密码忘记了
4.系统蓝屏(有访问时),没采集到蓝屏时的图像(代码)

二、沟通处理流程、建议

和网管员沟通,大体处理流程是先检测硬件,再检测系统软件,如果硬件有问题直接更换,系统有问题可能要重装系统。
问题是有个OA应用需要安装,但联系不到人了,这个到时看了情况再说。

三、处理流程:

0.准备工作,BIOS关键设置照相保存,如硬盘模式是RAID1、启动模式是MBR,硬件信息了解等。
联想Think Server TS540/440蓝屏故障处理
联想Think Server TS540/440蓝屏故障处理
联想Think Server TS540/440蓝屏故障处理
1.PE烤机检测温度75度以内、内存8G D3,正常但机箱灰比较多。
联想Think Server TS540/440蓝屏故障处理
联想Think Server TS540/440蓝屏故障处理
2.Diskgen检测硬盘无坏道,但DG启动很慢。
3.更改管理员帐户密码(备份文件先),从硬盘启动系统,正常但有点慢。
4.登录进入系统后查看系统日志、桌面及其它可能的系统信息文件记录。
5.约5分钟出现蓝屏,代码是STOP:0x000000D1, iaStora.sys报错。查询sys文件为Intel快速存储技术驱动文件,确认是设备管理器里存储控制器的驱动文件,有Intel的签名。引起蓝屏可能是驱动不稳定或者软件冲突。
联想Think Server TS540/440蓝屏故障处理
联想Think Server TS540/440蓝屏故障处理
6.一是换驱动未成。找联想官网,无相应驱动,找联想服务,因非工作日不提供技术服务,只丢了个网页链接给我,没找到相应的驱动。二是移除可能的冲突软件。移除QQ电脑管家,移鲁大师,其它查看没什么特别的软件了,就重启服务器观察。
7.观察约10+分钟,再无蓝屏现象。难道就这么轻松,真的是软件冲突引起的?
8.感觉系统启动速度有点慢,然后检测还差一个写入操作。就直接从硬盘E盘选取一个1.5G左右的文件复制写入D盘,结果卡死。看来还有问题!
9.关机重启,自检画面有RAID1的信息,因为一闪而过,一直没来得及拍照。检测期间多次重启,终于抓拍到,RAID1 Staus是Degraded,这个正常不应该是OK吗?一查是降级(英语不怎么好呀),照片下边还有一个ST1T的Size是3.8G,瞬间明白了:这就是ST1T硬盘有问题呀!
联想Think Server TS540/440蓝屏故障处理
10.把ST1T硬盘取掉。测试使用正常。
11.报告相关人员,提交处理建议。问题解决。

四、总结

0.要有一个问题处理的流程,按规矩、按程序、按标准。
1.问题处理前的信息、沟通、拍照记录配置很重要,了解得越多越容易找到问题的关键。
2.数据第一,全程注意关键数据备份、勿更改非必要的数据。
3.你忽略的信息可能是关键信息。比如一早就把RAID自检信息拍下来,可能就用不了这么长的时间。