Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >存储崩溃的数据恢复通用方法

存储崩溃的数据恢复通用方法

原创
作者头像
北亚数据恢复中心
修改于 2019-12-11 02:09:26
修改于 2019-12-11 02:09:26
9350
举报
文章被收录于专栏:数据恢复案例数据恢复案例

服务器数据恢复指的是通过技术手段将原本存储在服务器、存储设备内的,由于误操作、硬件故障、恶意攻击等原因丢失的数据进行修复提取的专业技术。在介绍服务器数据恢复前我们首先需要了解服务器的数据结构文件存储原理,今天小编通过一起华为s5300服务器数据介绍该型号服务器的数据存储结构和数据恢复原理。

【服务器数据恢复故障描述】

今天为大家介绍的案例故障服务器型号为华为s5300服务器,需要进行数据恢复的服务器内一共有24块硬盘组成一组raid5盘阵,其中一块硬盘为热备盘。在服务器正常运行过程中有一块硬盘离线激活了热备盘进行数据同步,在数据同步的过程中服务器内另一块硬盘因为未知故障离线,导致服务器上层应用崩溃,服务器内的数据丢失

【服务器数据恢复检测】

接到客户服务器内所有硬盘后首先对硬盘进行逐一检测,发现除1块硬盘外其他硬盘均不存在物理故障。考虑到客户原始数据安全性,服务器数据恢复工程师需要将所有硬盘进行镜像备份。

【服务器数据恢复过程】

1. 分析服务器故障原因

由于华为s5300的控制器检查磁盘的策略相当严格,对于没有物理故障但性能不稳定的硬盘会当做坏盘踢出raid阵列。服务器数据恢复工程师检测到有一块硬盘存在物理故障,因此该服务器掉线的两块盘其中有一块是因为读写不稳定掉线。

2. 分析服务器内raid结构

针对服务器硬盘掉线数据恢复案例,想要恢复lun首先需要分析底层的raid结构信息,根据分析得出的raid阵列信息重组raid。服务器数据恢复工程师对每一块硬盘进行分析,得出了raid阵列的条带大小、数据走向、硬盘顺序、热备盘、数据库的分布规律等基础信息。

3. 通过校验排查服务器内被同步硬盘

根据已经分析得到的服务器阵列信息,数据恢复工程师使用自主研发的raid虚拟程序进行重组原始阵列,但是在重组过程中发现有一块硬盘内的数据被同步破坏,我们在数据恢复过程中需要将被损坏的硬盘排除,数据恢复工程师将所有硬盘进行底层数据结构对比,发现了其中一块硬盘在相同条带上的数据与其他硬盘明显不同,使用raid校验程序对该硬盘进行条带校验后确认该硬盘已被同步破坏。服务器数据恢复工程师重组raid阵列后分析lun在raid组中的分配情况及数据块map,只要能够完整的将map提取,即可借助数据恢复程序进行解析并恢复lun数据。

4. 提取服务器内数据库文件并修复数据库

服务器数据恢复工程师自主编写了文件系统解析程序对虚拟阵列内的文件系统进行解析,导出数据库文件后移交数据库数据恢复工程师进行校验和修复。

数据库工程师对数据库文件进行验证发现部分数据库文件及日志文件异常。表空间内存在大量坏块、所有控制文件被破坏,undotbs02丢失,数据库数据恢复工程师只好对数据库文件进行修复,修复过程见下图:

华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程
华为存储硬盘离线导致数据丢失恢复过程

【服务器数据恢复结果验证】

经过数据库数据恢复工程师对数据的修复和验证,最终成功恢复服务器内的数据库,服务器数据恢复工程师将修复成功的数据库数据导入数据恢复服务器进行验证,所有数据正常,联系客户进行现场数据验证均无异常,本次数据恢复服务器100%恢复。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
存储硬盘离线VXFS文件系统恢复教程
图片1.png 服务器数据恢复故障描述 客户的服务器共有8块450GB SAS硬盘,其中7块硬盘组成一个RAID5阵列,1块热备盘。阵列中2块硬盘损坏并离线,导致RAID5阵列瘫痪,进而影响上层LUN无法正常使用。经工程师检测硬盘无物理故障,无坏道,随后北亚工程师将所有磁盘镜像成文件。 数据恢复过程 一、RAID组结构及掉线盘分析 服务器的LUN都是基于RAID组的,所以需要先对底层RAID组的信息作出分析,再依据这些数据重构原始的RAID组。通过分析得知4号盘为hot Spare盘。继续分析Oracl
北亚数据安全与救援
2021/05/27
2.8K0
存储硬盘离线VXFS文件系统恢复教程
服务器数据恢复案例-一顿操作猛如虎
本次数据恢复案例的背景是一台装有20块硬盘的普通服务器,由于未知原因上层业务突然崩溃,机房管理员对服务器进行检查发现导致服务器崩溃的主要原因是服务器上有3块硬盘离线,管理员将服务器内的所有硬盘按照现有盘序从槽位取出后携带硬盘来到北京某数据恢复中心进行服务器数据恢复操作。
北亚数据恢复中心
2019/07/31
8640
服务器数据恢复案例-一顿操作猛如虎
案例讲解服务器硬盘离线数据恢复方法-数据恢复
服务器简单来说就是计算机的一种,具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。多数企业配备有自己的服务器,同时也带来了服务器故障导致数据丢失的困惑,毕竟更换一台新设备无法恢复原有的设备,今天给大家简单介绍一下服务器硬盘故障导致数据丢失后的数据恢复方法,下面是案例背景。
北亚数据恢复中心
2020/02/04
1.5K0
案例讲解服务器硬盘离线数据恢复方法-数据恢复
Raid5磁盘阵列数据恢复思路分析--附真实案例
Raid5磁盘阵列是一种相对安全的磁盘阵列形式,数据分布状态有点类似于raid0磁盘阵列。但是raid5阵列比raid0阵列更为安全的一点就是阵列的每一组平行数据块中都包含了一个校验块,校验块的作用主要表现在阵列有一块硬盘掉线的时候,可以保证磁盘阵列依旧正常运行,数据不受影响。不过raid5阵列中如果有一块硬盘离线了就需要及时更换硬盘或上线,否则等第二块硬盘离线时阵列便失效了。此时想要恢复数据需要将raid5阵列中的所有硬盘按照原始存储数据的顺序拼接重组即可。
北亚数据恢复中心
2020/07/22
1.6K0
Raid5磁盘阵列数据恢复思路分析--附真实案例
存储瘫痪抢救Oracle数据库案例
本次分享的案例是关于HP FC MSA2000存储瘫痪抢救Oracle数据库的案例,故障存储整个存储空间由8块硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用。由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用。 由于存储是因为RAID阵列中某些磁盘掉线,从而导致整个存储不可用。因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障。排除物理故障后对数据全部备份后在进行进一步的分析。 【故障分析】 1、分析故障原因 由于前两个步骤并没有检测到磁盘有物理故障或者是坏道,由此推断可能是由于某些磁盘读写不稳定导致故障发生。因为HP MSA2000控制器检查磁盘的策略很严格,一旦某些磁盘性能不稳定,HP MSA2000控制器就认为是坏盘,就将认为是坏盘的磁盘踢出RAID组。而一旦RAID组中掉线的盘到达到RAID级别允许掉盘的极限,那么这个RAID组将变的不可用,上层基于RAID组的LUN也将变的不可用。目前初步了解的情况为基于RAID组的LUN有6个,均分配给HP-Unix小机使用,上层做的LVM逻辑卷,重要数据为Oracle数据库及OA服务端。 2、分析RAID组结构 HP MSA2000存储的LUN都是基于RAID组的,因此需要先分析底层RAID组的信息,然后根据分析的信息重构原始的RAID组。分析每一块数据盘,发现4号盘的数据同其它数据盘不太一样,初步认为可能是hot Spare盘。接着分析其他数据盘,分析Oracle数据库页在每个磁盘中分布的情况,并根据数据分布的情况得出RAID组的条带大小,磁盘顺序及数据走向等RAID组的重要信息。 3、分析RAID组掉线盘 根据上述分析的RAID信息,尝试通过北亚RAID虚拟程序将原始的RAID组虚拟出来。但由于整个RAID组中一共掉线两块盘,因此需要分析这两块硬盘掉线的顺序。仔细分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是最先掉线的,通过北亚RAID校验程序对这个条带做校验,发现除掉刚才分析的那块硬盘得出的数据是最好的,因此可以明确最先掉线的硬盘了。 4、分析RAID组中的LUN信息 由于LUN是基于RAID组的,因此需要根据上述分析的信息将RAID组最新的状态虚拟出来。然后分析LUN在RAID组中的分配情况,以及LUN分配的数据块MAP。由于底层有6个LUN,因此只需要将每一个LUN的数据块分布MAP提取出来。然后针对这些信息编写相应的程序,对所有LUN的数据MAP做解析,然后根据数据MAP并导出所有LUN的数据。 【数据恢复过程】 1、解析修复LVM逻辑卷 分析生成出来的所有LUN,发现所有LUN中均包含HP-Unix的LVM逻辑卷信息。尝试解析每个LUN中的LVM信息,发现其中一共有三套LVM,其中45G的LVM中划分了一个LV,里面存放OA服务器端的数据,190G的LVM中划分了一个LV,里面存放临时备份数据。剩余4个LUN组成一个2.1T左右的LVM,也只划分了一个LV,里面存放Oracle数据库文件。编写解释LVM的程序,尝试将每套LVM中的LV卷都解释出来,但发现解释程序出错。 仔细分析程序报错的原因,安排开发工程师debug程序出错的位置,并同时安排高级文件系统工程师对恢复的LUN做检测,检测LVM信息是否会因存储瘫痪导致LMV逻辑卷的信息损坏。经过仔细检测,发现确实因为存储瘫痪导致LVM信息损坏。尝试人工对损坏的区域进行修复,并同步修改程序,重新解析LVM逻辑卷。 2、解析VXFS文件系统 搭建环境,将解释出来的LV卷映射到搭建好的环境中,并尝试Mount文件系统。结果Mount文件系统出错,尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,但修复结果还是不能挂载,怀疑底层vxfs文件系统的部分元数据可能破坏,需要进行手工修复。 3、修复VXFS文件系统 仔细分析解析出来的LV,并根据VXFS文件系统的底层结构校验此文件系统是否完整。分析发现底层VXFS文件系统果然有问题,原来当时存储瘫痪的同时此文件在系统正在执行IO操作,因此导致部分文件系统元文件没有更新以及损坏。人工对这些损坏的元文件进行手工修复,保证VXFS文件系统能够正常解析。再次将修复好的LV卷挂载到HP-Unix小机上,尝试Mount文件系统,文件系统没有报错,成功挂载。 4、检测Oracle数据库文件并启动数据库 在HP-Unix机器上mount文件系统后,将所有用户数据均备份至指定磁盘空间。所有用户数据大小在1TB左右。 使用Oracle数据库文件检测工具“dbv”检测每个数据库文件是否完整,发现并没有错误。再使用北亚Oracle数据库检测工具,发现有部分数据库文件和日志文件校验不一致,安排北亚工程师对此类文件进行修复
北亚数据安全与救援
2021/11/15
7350
RAID5阵列崩溃/重建/同步后的数据恢复过程
一台HP 服务器,挂接一台raid5磁盘阵列,内接5块1TB硬盘,原先结构为RAID5。
北亚数据恢复中心
2019/09/23
5.9K0
RAID5阵列崩溃/重建/同步后的数据恢复过程
服务器硬盘离线数据恢复成功案例
服务器内有两块硬盘掉线,现在服务器内的lun丢失了,数据恢复工程师开始对故障服务器进行检测发现掉线的硬盘并没有存在物理故障、也没有坏道等其他故障。于是开始对客户的故障服务器进行镜像备份。
北亚数据恢复中心
2019/10/31
1.4K0
服务器硬盘离线数据恢复成功案例
EMC存储崩溃恢复案例
本次分享的案例为EMC FC AX-4存储崩溃,整个存储空间由12块1TB STAT的硬盘组成的,其中10块硬盘组成一个RAID5的阵列,其余两块做成热备盘使用。由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用。由于存储是因为某些磁盘掉线,从而导致整个存储不可用。因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障。接着使用坏道检测工具检测磁盘坏道,发现也没有坏道。
北亚数据安全与救援
2020/11/24
2K0
RAID出故障如何做好应急处理
当RAID出现: 1、RAID控制台里描述超过允许范围内的盘数异常,如RAID0里一块以上盘异常;RAID5(无热备)里2块以上盘异常;异常表现为OFFLINE或DDD、BAD等;2、服务器存储系统报警(喇叭或警示灯);3、系统无法识别RAID 逻辑硬盘等问题时,现场工程师应该如何操作才能挽救数据呢?(此方案适用 IBM、HP、SUN、DELL、DFT、APPLE、联想、方正等品牌服务器;RAID0、RAID1、RAID2、RAID3、RAID4、RAID5、RAID6、HP ADG、RAID10、RAID50、RAID1E、RAID5E、RAID5EE等;NAS、DAS、SAN等。)
北亚数据安全与救援
2021/04/07
1.9K0
RAID出故障如何做好应急处理
raid5掉了一块盘后重建了,原来的数据怎么恢复
一台HP 服务器,挂接一台HP MSA50磁盘阵列,内接5块1TB硬盘,原先结构为RAID5。
北亚数据恢复中心
2020/01/14
5.2K0
raid5掉了一块盘后重建了,原来的数据怎么恢复
EMC CX4-480存储成功恢复案例分享
本次北京北亚数据恢复小编分享的数据恢复的案例是关于EMC CX4-480型号存储,该存储内共20块硬组成RAID5磁盘阵列;两个45T的LUN。
北亚数据安全与救援
2021/06/28
1K0
EMC CX4-480存储成功恢复案例分享
IBM存储RAID5数据恢复案例
本次北亚小编分享的案例是关于IBM存储DS3512,6块盘,坏了多块盘,导致阵列失效,数据丢失。
北亚数据安全与救援
2021/02/01
1.5K0
IBM存储RAID5数据恢复案例
SAN LUN Mapping出错,文件系统共享冲突;服务器数据恢复成功
本次数据恢复服务器为SUN 光纤存储系统,中心存储为6枚300G硬盘组成的RAID6,划分为若干LUN,MAP到不同业务的服务器上,服务器上运行SUN SOLARIS操作系统。
北亚数据恢复中心
2020/02/27
7030
SAN LUN Mapping出错,文件系统共享冲突;服务器数据恢复成功
上海某公司RAID5阵列恢复案例教程
某公司使用的存储,采用RAID5磁盘阵列,由于未知的原因导致存储忽然崩溃无法启动,RAID5阵列中的虚拟机全部丢失,其中3台虚拟机为重要数据,需要主要针对该3台虚拟机进行数据恢复。
北亚数据安全与救援
2021/05/25
1.1K0
上海某公司RAID5阵列恢复案例教程
HP存储RAID5硬盘离线LVM下VXFS文件系统恢复教程分享
在HP存储RAID5硬盘离线LVM下VXFS文件系统是如何进行恢复的呢?HP存储也是在企业中常用的存储设备了,本次分享的故障设备为:HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,整个存储空间由8块450GB SAS的硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用。
北亚数据安全与救援
2021/05/07
8480
HP存储RAID5硬盘离线LVM下VXFS文件系统恢复教程分享
服务器崩溃导致数据库损坏的修复方法
故障服务器上一共16块FC硬盘,单盘容量600G。存储前面板10号和13号硬盘亮黄灯,存储映射到redhat上的卷挂载不上,服务器业务崩溃。
北亚数据恢复中心
2019/10/25
2.7K0
服务器数据恢复案例介绍;服务器崩溃修复
某法院的一台服务器由于硬盘出现故障导致服务器崩溃,在当地一家数据恢复机构进行了数据恢复操作,但是数据恢复没有成功,于是负责人在北京寻找服务器数据恢复公司进行数据恢复。这台服务器的基本配置情况如下图中所示。
北亚数据恢复中心
2019/10/23
1.9K0
服务器数据恢复案例介绍;服务器崩溃修复
IBM 3650服务器崩溃数据恢复案例
IBM 3650服务器中共有5块 SAS 300GB 磁盘组成一组RAID5磁盘阵列,存储划分为一个LUN、3个分区,第一个分区存放的是windows 2003系统,第二个分区用于存储 SQL Server 2010生产库,第三个分区是备份分区。
北亚数据安全与救援
2021/01/14
3.2K0
实例解析vsan分布式存储架构故障如何恢复数据
VSAN是一种应用于服务器、存储的以vSphere内核为基础进行开发、可扩展的分布式存储架构。VSAN通过在服务器vSphere集群主机当中安装闪存和硬盘来构建VSAN存储层。这些设备由VSAN进行控制和管理,VSAN形成一个供vSphere集群使用的统一共享存储层。同其他服务器架构一样,vsan也会出现故障导致服务器数据丢失,今天为大家介绍一例由于服务器异常断电导致vsan逻辑架构异常、虚拟磁盘文件丢失的数据恢复成功案例。
北亚数据恢复中心
2019/12/03
1.4K0
实例解析vsan分布式存储架构故障如何恢复数据
服务器数据丢失的恢复过程
今天分享的是一例服务器数据恢复的成功案例,需要进行数据恢复的服务器故障情况为raid信息丢失,服务器型号为某品牌380系列服务器,服务器上面安装了多块硬盘组成riad5阵列进行存储,服务器内存储的文件类型是普通文件,在正常工作状态下服务器意外断电,管理员重启服务器后发现该服务器内的raid信息丢失了,服务器无法使用。
北亚数据恢复中心
2019/10/21
2.1K0
服务器数据丢失的恢复过程
推荐阅读
相关推荐
存储硬盘离线VXFS文件系统恢复教程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档