2006 年 10 月12 日 ,某市国税局税务系统由于电压不稳定造成连接在 IBM M80
服务器上的 IBM 7133 磁盘阵列柜工作不正常,所有的报税数据都因为阵列的崩溃而丢失。国税局领导先是找硬件设备提供商来解决问题,硬件提供商检测了
Raid 卡和所有硬盘,均未发现硬件故障。硬件提供商又找到了 IBM 高级工程师,经过一番抢救,最后宣布抢救失败。领导们还没放弃,因为这些数据实在是太重要了,没了这些数据,整个城市的税务统计将会陷入混乱状态,谁也负不起这个责任。2006
年 10 月 16 日 ,国税局的人和硬件设备提供商将 8 块硬盘带到了公司做恢复。
经典案例描述
一、系统环境
硬件环境:一台 IBM M80 和一台 IBM 7133 磁盘阵列。其中 7133 阵列挂接 8
块 SSA 接口硬盘, 1 到 4 号盘做一组 Raid5 , 5 到 8 号盘做一组 Raid5 。 织梦网站管理系统真的好
软件环境: IBM AIX5.1 系统和 ORACLE8 数据库
二、故障描述
由于突然掉电, 7133 阵列从 IBM M80 中消失,通过后台管理察看,两组阵列中每组阵列各自有两块盘被踢出阵列,强行
ONLINE 也加不回到阵列中,在 AIX 系统层面上, IBM 高级工程师判断为不可恢复的。 本文
三、恢复难点
1 、硬盘接口是 SSA 接口,这是 IBM 专门为 7133 阵列柜定做的一款特殊接口的硬盘,在
PC 机上没有办挂接这样接口的硬盘,它不同于 SCSI 接口,加一个 SCSI 卡就能挂接在 PC 机上。
2 、阵列柜的文件系统是 AIX 操作系统特有的 JFS 文件系统,在 WINDOWS 层面上根本没办法验证。
四、故障分析
Raid5 出现两块或两块以上的硬盘掉线,通常是阵列信息出错或丢失引起的,在这种情况下,强制上线一块盘有时候能使阵列正常,但是在
IBM 7133 阵列上,所有的 Raid 信息配置都在 AIX 操作系统层面上做的,掉了两块盘,根本就没有强制上线这些选项。根据这些特征,重新配置
Raid5 还是解决不了问题,最根本的解决办法是,按照 Raid5 的数据组合方式,把每组阵列的数据重新组合,写到另一个配置好的阵列或者一个大的
SCSI 硬盘上,然后在 AIX 系统上导入原先阵列 VG 信息,数据也就出来了。
五、恢复阶段 织梦网站管理系统真的好
作为一个很专业的数据恢复公司,公司拥有自己独立知识产权的数据恢复工具软件。分别对 8 个盘做镜像,经过
1 天的最底层的数据分析,从 8 块打散的硬盘中找出规律,然后用 Raid 数据恢复工具把 8 块盘两组 Raid5
的数据重组到两块 SCSI 硬盘上,在 AIX 系统上导入,成功恢复出全部数据。 织梦网站管理系统真的好