2013年1月下旬,本公司接到了一个相对复杂且棘手的任务:帮助西区国翔公寓的网络管理员恢复他们的服务器系统,使之能够正常工作。我们的工程师到现场首先查看了服务器系统环境。服务器为IBM MX400,磁盘阵列为RAID-1,已经使用了若干年,磁盘本身已经有一定程度的老化。当时出现的问题为由于突然断电,导致磁盘磁头未能归位,对磁盘中存储服务器操作系统的关键部位造成了损坏,导致系统无法正常启动。当时该公司网络管理员采取的措施是将该阵列的镜像磁盘临时用于服务器正常使用。 将那块损坏的磁盘拿回公司检测后,发现关键扇区有损坏,系统无法恢复,但是数据部分可以恢复,于是便把该公司的重要数据库文件恢复出来以作备用。然后便拿一块新的硬盘回到该公司重新恢复组建RAID-1使该服务器可以完全恢复正常。在回去操作的时候,那块原来正常使用的硬盘突然也出现了故障,磁盘RAID信息出现了错误,导致磁盘所有数据无法恢复。我们之前对于那块早先损坏的硬盘中的数据库文件的备份此时便发挥了作用。 我们又拿出一块新盘,在服务器中组建了完全新的RAID-1,然后重装了原先的操作系统Suse Linux 10.0,并且联系住宿管理系统的公司重新搭建了软件环境。最后连接上我们之前恢复的数据库文件,最后促使该公司的大量数据信息得以保留,没有对于整个公司的正常运营造成灾难性的损失。 该案例的成功多少有一些运气成分,如果我们没有对当时那块已经损坏的磁盘中的数据库文件进行恢复,后面这块磁盘的突然崩溃必将造成不可挽回的损失。所以小型企业也一定要重视数据的备份和对于磁盘的及时检测与维护,防止类似的危险情况发生。 |