新足迹

 找回密码
 注册

精华好帖回顾

· 偶也来做个2010年度回顾-狠多图 (2011-1-5) zzoz · 大头山寨的 “老干妈” 豆豉辣酱 (2012-3-18) datou2z
· 三个月送旧迎新 -- Subaru WRX拉力蓝购车记 (2017-9-9) 捷足先登 · 把炒菜当艺术品来弄 - 东坡肉 (2009-8-30) 老陶
Advertisement
Advertisement
查看: 6756|回复: 144

完结:Raid损毁后修复 [复制链接]

退役斑竹

发表于 2020-5-20 09:21 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dingyipu 于 2020-5-21 17:16 编辑

Raid损毁后,尝试mount无果。因为Bad sector太多,所以打算clone然后再进行下一步操作。(Raid一块硬盘损坏后新硬盘进行修复,结果修复到90%的时候,另一块硬盘掉线,经检查是bad sector过多,无法重启Raid。)

将刚损毁的硬盘IDE接入Desktop后,识别出Raid Partition。因为此硬盘数据up to date,所以此硬盘数据对恢复Raid最有意义。

使用WinPE引导启动后,无法识别损毁硬盘内容,认为是新盘。

使用Linux系统引导,可以识别Raid Partition,基于此进行Clone。SMART显示Failure is imminent。

Redo Recovery报错,使用Clonezilla进行Clone,操作进行至30%后Fail跳出,证明Bad Sector位置。使用Clonezilla Expert,选择-r (Rescue),跳过Bad Sector克隆。可以进行,遇到Bad Sector时,速度极慢,1MB/min。

现在System Partition进行到90%,Raid Partition还未开始,看来遥遥无期。发个帖子,欢迎有经验人士分享,待续。

----------------------------------------更新--------------------------------------------

果然太顺利就是有幺蛾子,我之前还想说都能拷贝文件出来了,应该没问题了。检查了一下,照片都只有一半...后来看了clone的内容,感觉最后一半fail了,没有clone出来。Clonezilla看样子handle不了这个case。开始准备使用DDrescue。

好在DDrescue在Clonezilla Live自带,所以也不用再多做准备,还是用Clonezilla启动。

使用Ctrl+Alt+F2进入Shell。进行操作前,先使用sudo -i 进入root,否则对于device都是Permission Denied。进入root以后,使用fdisk -l命令,对所有device进行列表,果然每个系统都不一样,一定要查好再输入命令。否则dd直接毁了数据。我这里就图快了,直接disk to disk拷贝,想早点修好,否则image做个中转,我下周才能修好...

ddrescue -f -n /dev/(source) /dev/(destination) /root/recovery.log

一开始就出了5个read error,修复时间预计9小时。

突然想到一个很严肃的问题,我之前mount了所有硬盘。虽然后台没有运行service,也没有任何写入操作(只读取了文件)。现在就算我新clone了一遍,还能和其他硬盘自动mount吗?虽然我认为这个clone和其他HDD的数据差异不大,但我想time stamp什么的应该都不同了。

我现在想先弄新clone上去试试,不行的话,我还有备用硬盘,打算这么搞:

ddrescue clone我之前的clone(已经和其他硬盘mount过了)到新HDD。然后把我新的clone的Raid Partition(不包括系统部分)ddrescue到新HDD的Raid Partition。不过似乎对timestamp什么的没有啥作用吧。不知道。HDD上面有三个Partition,第一个应该是系统,第二个是一些文件列表?第三个是Raid。

----------------------------------------更新--------------------------------------------

早上看到第一步程序已经跑完了,non-scraped 是84MB, bad sector 343KB, bad areas 671。

开始运行第二步,偷了懒,打算不用-f,想说试试:

ddrescue -d -r3,结果报错,显示Output file exists and is not a regular file. 因为是直接disk to disk,必须-f。

所以只能ddrescue -d -f -r2,这里算了一下,觉得时间太久,所以读取bad sector只尝试2遍。结果我还是太乐观了。程序开始跑起来了,基本上4s一kB,所以我快速计算得出需要90小时...还好ddrescue可以中断。看情况吧,如果只是这样应该也算满意。晚些mount看结果,希望一切顺利。

----------------------------------------更新--------------------------------------------

确定Raid三个Partition分别是系统、Swap和Data。损坏小部分在系统,大部分在data。其实我不怕系统坏,因为Synology在每块硬盘都装了系统。data的损伤在80MB,希望是老损伤,都已经mapping掉了。

我下午中断了bad sector的尝试修复。因为5个小时修复了2个地方,总共有600+的地方有错。反正80MB,我的文件都是照片和录像,所以理论上应该影响不大。

Ctrl C中断。重启后查看了一下硬盘,没什么问题,两块硬盘的粗略数据分析结果一样。Moment of Truth.

将新Clone的硬盘插入Raid阵列,启动...

可惜还是Crash,没有自动Mount。

查看数据,因为Event count不一样,所以没有自动Mount。(我之前不是Mount过一次了,用之前的那块Clone HDD)

没有办法,强制Mount,死马当活马医。当然,我的另一块同时宕机的硬盘也能备用,反正是夜里挂掉的(所以我没来得及维护),差别只是我的监控录像。看不了也不心疼。

抱着试一试的心态,Mount了一下,挺顺利,直接看到所有的文件列表。

随机抽样照片,清晰极了。

自此修复算是圆满结束。现在家里的几台电脑都在飞奔Back up。新买了几个6TB黑盘,不能浪费了...装满再说:P

结语:我以前经常因为硬盘损毁而丢失照片。所以用了Raid来保存照片。但显然我高估了Raid的数据安全能力,现在开始评测AWS的网络存储。不过最低等级的S3也很贵,毕竟我要存几十个T。希望大家多交流,也祝大家数据安安全全,没有像我一样的困扰。

另祝自己能够修复以前的三块硬盘(也是类似情况,现在鼓捣出来了,看看能不能顺带修复了。)

评分

参与人数 2积分 +9 收起 理由
商务车 + 5 感谢分享
gzrain + 4 偶对你的景仰如滔滔江水

查看全部评分

Advertisement
Advertisement

退役斑竹

发表于 2020-5-20 09:23 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
在等待期间,准备了另一块新硬盘,随时准备ddrescue。据说ddrescue要求一模一样的硬盘,找同一型号的费了一番功夫。

发表于 2020-5-20 09:45 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
raid几?我向来坚持raid1.这样的问题基本不会遇到

退役斑竹

发表于 2020-5-20 09:52 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
idog8818 发表于 2020-5-20 09:45
raid几?我向来坚持raid1.这样的问题基本不会遇到

之前没想到大容量硬盘Raid5会这么坑。现在先修复了再调整吧。Raid5看来只适合小容量硬盘。

退役斑竹

发表于 2020-5-20 09:52 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
主要单片修复时间过长,当另一片突然出问题掉线就垮了。

发表于 2020-5-20 09:54 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
5其实也很尴尬。。我曾经10都掉过数据,坏2盘资料全丢。从此以后只用1.别和我提容量减半。掉了数据就知道容量减半都是小事
Advertisement
Advertisement

发表于 2020-5-20 09:56 |显示全部楼层
此文章由 aqianer 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 aqianer 所有!转贴必须注明作者、出处和本声明,并保持内容完整
还是多做个冷备份更重要
听说过很多raid5掉盘,然后回复过程中又掉,数据全丢

发表于 2020-5-20 10:33 |显示全部楼层
此文章由 kane321 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kane321 所有!转贴必须注明作者、出处和本声明,并保持内容完整
家用千万别raid5,甚至raid 1也要有选择的用其实,多盘做备份就是了

发表于 2020-5-20 10:50 来自手机 |显示全部楼层
此文章由 berlindut 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 berlindut 所有!转贴必须注明作者、出处和本声明,并保持内容完整
idog8818 发表于 2020-5-20 09:24
5其实也很尴尬。。我曾经10都掉过数据,坏2盘资料全丢。从此以后只用1.别和我提容量减半。掉了数据就知道容 ...

raid10应该最安全啊,为啥坚持raid 1

发表于 2020-5-20 11:26 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
berlindut 发表于 2020-5-20 10:50
raid10应该最安全啊,为啥坚持raid 1

raid10追求速度和冗余。 我当时mirror的2个盘都坏了。那么数据就不完整了,全部数据损坏。我选择raid1,1个是简单,1个是2个可以算是单独的盘,有坏区也可以拉出正常数据,不至于全坏。我放弃了速度,我对传输速度要求不是那么高。100M/S足够我用了。



发表于 2020-5-20 11:32 |显示全部楼层
此文章由 Bomsori 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Bomsori 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我也想請問下樓主的事故是發生在公司嗎? 感謝!!
Advertisement
Advertisement

退役斑竹

发表于 2020-5-20 11:46 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
aqianer 发表于 2020-5-20 09:56
还是多做个冷备份更重要
听说过很多raid5掉盘,然后回复过程中又掉,数据全丢 ...

就是这样。按理说纯数学概率很低,但仔细想一下,少了一个硬盘,对其他硬盘的读写就会加倍,出错几率就会大。感觉这个情况挺普遍,打算以后都上Raid1, 别和我说容量减半,真的不是事儿。

退役斑竹

发表于 2020-5-20 11:47 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
idog8818 发表于 2020-5-20 09:54
5其实也很尴尬。。我曾经10都掉过数据,坏2盘资料全丢。从此以后只用1.别和我提容量减半。掉了数据就知道容 ...

非常赞同,也是吃一堑长一智吧。

退役斑竹

发表于 2020-5-20 11:49 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
kane321 发表于 2020-5-20 10:33
家用千万别raid5,甚至raid 1也要有选择的用其实,多盘做备份就是了

我看到Mwave有卖6个盘的duplicator...主要以前没有意识到还能批量坏...真的是连着掉线...崩溃了

退役斑竹