4月10的下午,宁波海曙区的某汽车配件公司的张先生打来电话,说公司的DELL服务器同时出现了两个硬盘亮红灯的现象。张先生第一时间反应是通过DELL的技术部门提供技术支持,通过800电话的咨询后,强制把硬盘上线可能会导致系统无法启动,数据会永久丢失,这台服务器是有6块
说起
因为数据的重要性加上事情比较急,
在所有恢复的过程中,如果不通过技术手段进行分析出坏盘数据,盲目强制上线会导致的后果是非常的严重,数据丢失是不可避免的了。DELL的工程师也建议过客户不能做相关破坏数据和没有把握的技术工作,挽回了损失,数据恢复选择回天,没有错。
下面我们分析一下,RAID数据丢失的可能性。造成服务器RAID故障的原因有两个,一个是服务器中的硬盘出现故障,另一个是人为的误操作。
1.硬盘损坏 对于RAID1、3、5来说,只允许其中的一块盘损坏,当发生第二块盘损坏的情况后,该服务器将全线崩溃。 对于RAID0+1来说,同组硬盘只允许一块盘损坏,而不同组可以允许分别损坏一块盘,即两块盘。 对于RAID6来说,允许两块盘同时掉线,但是当发生第三块盘掉线的现象后,系统将直接崩溃。
对于RAID5加热备盘来说,允许两块盘掉线。当一块盘掉线后,热备盘会在进行Rebuild后顶替上去,此后,如果再有一块盘发生故障掉线,该阵列将全部崩溃。RAID5E和RAID5EE的原理同上。
2.人为误操作 RAID阵列常出现两块盘同时掉线的故障,此时,原厂家会建议用户强制上线,这种做法存在着极大的风险。如果该盘是同时掉线,这种方法能够及时的解决故障。但是如果其中一块盘掉了很久,紧接着又一块或者多块盘掉线,此时,数据新鲜度不一样,强制上线后,RAID卡会做同步操作,最终导致老的数据可用,新的数据丢失。此外,错误的重新配置RAID也会造成数据的丢失。所以RAID出现问题后,我们建议客户立即停止任何非专业操作(包括磁盘自检),否则有可能发生数据的二次破坏。最好不要尝试Rebuild或进行初始化操作。