进入信息时代,各行业对数据安全和技术的要求越来越高,同时也遇到了各种服务器故障。虽然可以得到服务器厂商的支持,但往往费时费力(尤其是一些无法马上判断和解决的问题),给企业造成不必要的损失。最近,孟忠毅科技将与经理分享一些常见的服务器故障和解决方案,以更好、更快地排除故障。
01、服务器常见故障和现象
服务器无法启动的主要原因是:①市电或电源线故障(停电或接触不良);②电源或电源模块故障;③记忆失效(通常伴有警报声);④CPU故障(通常会有报警声);⑤主板故障;⑥其他卡造成的中断影响。
02.服务器无法启动
①检查电源线和各种输入输出接线是否连接正常。②连接电源线后检查主板是否通电。③将服务器设置为最小配置(只有单个cpu,最小内存,只有显示器和键盘),直接短接主板开关的跳线,看能不能启动。④检查电源,拔下所有电源接口,短路电源主板电源端口的绿线和黑线,看电源是否启动。⑤如果判断电源正常,需要用更换的方法排除故障。更换方法从最低配置下最容易更换的附件(内存、中央处理器和主板)开始。
03.系统频繁重启
系统频繁重启的原因:①停电(通过更换方法判断解决);②内存故障(可从BIOS错误报告中找到);③网口数据流过大(工作压力过大);④软件故障(通过更新或重新安装操作系统解决);
04、服务器崩溃故障判断处理;服务器崩溃很难判断,一般分为软件和硬件两个方面。
(1)、第一个方面——软件故障
①首先检查操作系统的系统日志,它可以用来判断崩溃的原因。②计算机病毒的成因。③系统软件存在bug或漏洞导致的崩溃,需要在判断硬件无故障后做出,需要软件提供商的帮助。④如果软件使用不当或系统工作压力过大,请客户适当降低服务器工作压力,看能否解决。
(2)、第二个方面——硬件故障
①硬件冲突。②在停电或供电不足的情况下,可以通过比较计算服务器电源的所有负载功率值来做出判断。③硬盘故障(扫描硬盘表面检查是否有坏磁道)。④内存故障(可以通过主板BIOS中的错误报告和操作系统报告的错误信息来判断)。⑤主板故障(用更换法判断)。⑥CPU故障(使用更换方法)。⑦板卡故障(通常是SCSI/RAID卡或其他pci设备也可能导致系统崩溃,可以通过更换的方法来判断和处理)。
注意:系统崩溃后,需要在一定压力下进行一段时间的复制测试,检查故障是否完全解决.
05.安装操作系统时,提示找不到硬盘
故障原因:①没有物理硬盘设备。②硬盘电缆连接问题。③硬盘控制器驱动程序未安装或驱动程序异相
06.如何找到司机
使用随机光盘制作相应的驱动器
07.硬盘控制器驱动程序仍然无法加载正确的驱动程序
检查主机raid功能是否已启用
08.新购买的硬盘安装到机器后,机器自检失败
(1)取出新硬盘,机器是否能通过自检;②检查新增硬盘的ID号是否与原硬盘相同。如果硬盘的标识号相同,自检将失败。
09.如何格式化SCSI硬盘
1.如果有操作系统:用磁盘管理工具格式化;2.无操作系统:SCSI管理控制界面中的格式;3.以ADAPTEC Raid卡为例:出现消息CTRL+A时,按CTRL+A进入。
①选择频道a..②选择SCSI UTILITY-将检测硬盘-选择要检测的硬盘。③选择FORMAT完全格式化硬盘。④选择验证以测试硬盘并检查是否有坏磁道。注意:格式化硬盘时不要中断或切断电源,否则会损坏磁铁。
10.艾西诺系列有RAID卡机。当其中一个硬盘不能正常工作时,RAID会报警,但系统可以正常运行,我该怎么办
1.使用新硬盘,确保容量大于或等于无法正常工作的硬盘。最好换成同型号的硬盘。2.与磁盘阵列卡相关的常见故障
第一类:RAID卡本身有问题
① RAID信息经常丢失,硬盘经常掉线,无法进行REBUILD,开机自检时无法检测到硬盘或者时间较长。
典型故障RAID1完成安装操作系统后,一切正常,但第二次重启系统时,会响起警报声。检查后发现有硬盘断开,REBUILD后恢复正常,但重启后又断开。怀疑硬盘故障,验证硬盘没有问题。最后更换RAID卡,解决问题。
典型故障b:机器经常死机,有时启动非常慢。查看系统日志,发现系统启动时出现错误信息:设备/devices/scsi/port0在等待传输的时间内没有响应。更换RAID卡后,恢复正常。
第二类:硬盘本身
(1)性能是硬盘掉线,RAID阵列中状态为DEAD,或者在重建时,取得一定进展就无法继续
典型故障:硬盘断开后,REBUILD完成时,达到20%时出现错误信息,无法继续。确认断开的硬盘、硬盘盒和SCSI电缆可以正常工作后,检查在线硬盘,发现有坏轨,修复硬盘,重做REBUILD,恢复正常。
第三类:硬盘盒或模块的接触问题
(1)这种问题往往说明RAID卡根本检测不到硬盘。这类问题比较简单,但在处理硬盘盒相关机器时,需要注意一些问题。
典型故障:在RIAD卡中检测不到硬盘,SCSI电缆连接到主板的ULTRA160接口,但故障还是一样。硬盘盒(不包括硬盘盒后面的支架)被拉出并更换,但故障仍然是一样的,但仍然无法更换硬盘。最后,卸下硬盘盒后面的支架(非热插拔部件),发现后支架80PIN接口上有一个针脚弯曲,将弯曲的针脚拉直,恢复正常。有不懂的请咨询梦飞服务器了解。