新足迹

 找回密码
 注册

精华好帖回顾

· 精心编制的中国蔬菜耕种季节表---【新增拉丁文名,帮助想带种子的TX!】图片在76楼~~~ (2012-4-30) Icebergrose · 重回 Brighton beach..................(17# 加两张) (2011-1-5) 星星星星
· 孩子语言发育延迟问题(非自闭症的一个非典案例) (2013-3-9) H妈妈 · 如果让我选择下一次的度假地,那么还是新西兰-九月的假期九天的南岛 (2016-10-20) guoguo01
Advertisement
Advertisement
查看: 8061|回复: 144

完结:Raid损毁后修复 [复制链接]

退役斑竹

发表于 2020-5-20 09:21 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dingyipu 于 2020-5-21 17:16 编辑

Raid损毁后,尝试mount无果。因为Bad sector太多,所以打算clone然后再进行下一步操作。(Raid一块硬盘损坏后新硬盘进行修复,结果修复到90%的时候,另一块硬盘掉线,经检查是bad sector过多,无法重启Raid。)

将刚损毁的硬盘IDE接入Desktop后,识别出Raid Partition。因为此硬盘数据up to date,所以此硬盘数据对恢复Raid最有意义。

使用WinPE引导启动后,无法识别损毁硬盘内容,认为是新盘。

使用Linux系统引导,可以识别Raid Partition,基于此进行Clone。SMART显示Failure is imminent。

Redo Recovery报错,使用Clonezilla进行Clone,操作进行至30%后Fail跳出,证明Bad Sector位置。使用Clonezilla Expert,选择-r (Rescue),跳过Bad Sector克隆。可以进行,遇到Bad Sector时,速度极慢,1MB/min。

现在System Partition进行到90%,Raid Partition还未开始,看来遥遥无期。发个帖子,欢迎有经验人士分享,待续。

----------------------------------------更新--------------------------------------------

果然太顺利就是有幺蛾子,我之前还想说都能拷贝文件出来了,应该没问题了。检查了一下,照片都只有一半...后来看了clone的内容,感觉最后一半fail了,没有clone出来。Clonezilla看样子handle不了这个case。开始准备使用DDrescue。

好在DDrescue在Clonezilla Live自带,所以也不用再多做准备,还是用Clonezilla启动。

使用Ctrl+Alt+F2进入Shell。进行操作前,先使用sudo -i 进入root,否则对于device都是Permission Denied。进入root以后,使用fdisk -l命令,对所有device进行列表,果然每个系统都不一样,一定要查好再输入命令。否则dd直接毁了数据。我这里就图快了,直接disk to disk拷贝,想早点修好,否则image做个中转,我下周才能修好...

ddrescue -f -n /dev/(source) /dev/(destination) /root/recovery.log

一开始就出了5个read error,修复时间预计9小时。

突然想到一个很严肃的问题,我之前mount了所有硬盘。虽然后台没有运行service,也没有任何写入操作(只读取了文件)。现在就算我新clone了一遍,还能和其他硬盘自动mount吗?虽然我认为这个clone和其他HDD的数据差异不大,但我想time stamp什么的应该都不同了。

我现在想先弄新clone上去试试,不行的话,我还有备用硬盘,打算这么搞:

ddrescue clone我之前的clone(已经和其他硬盘mount过了)到新HDD。然后把我新的clone的Raid Partition(不包括系统部分)ddrescue到新HDD的Raid Partition。不过似乎对timestamp什么的没有啥作用吧。不知道。HDD上面有三个Partition,第一个应该是系统,第二个是一些文件列表?第三个是Raid。

----------------------------------------更新--------------------------------------------

早上看到第一步程序已经跑完了,non-scraped 是84MB, bad sector 343KB, bad areas 671。

开始运行第二步,偷了懒,打算不用-f,想说试试:

ddrescue -d -r3,结果报错,显示Output file exists and is not a regular file. 因为是直接disk to disk,必须-f。

所以只能ddrescue -d -f -r2,这里算了一下,觉得时间太久,所以读取bad sector只尝试2遍。结果我还是太乐观了。程序开始跑起来了,基本上4s一kB,所以我快速计算得出需要90小时...还好ddrescue可以中断。看情况吧,如果只是这样应该也算满意。晚些mount看结果,希望一切顺利。

----------------------------------------更新--------------------------------------------

确定Raid三个Partition分别是系统、Swap和Data。损坏小部分在系统,大部分在data。其实我不怕系统坏,因为Synology在每块硬盘都装了系统。data的损伤在80MB,希望是老损伤,都已经mapping掉了。

我下午中断了bad sector的尝试修复。因为5个小时修复了2个地方,总共有600+的地方有错。反正80MB,我的文件都是照片和录像,所以理论上应该影响不大。

Ctrl C中断。重启后查看了一下硬盘,没什么问题,两块硬盘的粗略数据分析结果一样。Moment of Truth.

将新Clone的硬盘插入Raid阵列,启动...

可惜还是Crash,没有自动Mount。

查看数据,因为Event count不一样,所以没有自动Mount。(我之前不是Mount过一次了,用之前的那块Clone HDD)

没有办法,强制Mount,死马当活马医。当然,我的另一块同时宕机的硬盘也能备用,反正是夜里挂掉的(所以我没来得及维护),差别只是我的监控录像。看不了也不心疼。

抱着试一试的心态,Mount了一下,挺顺利,直接看到所有的文件列表。

随机抽样照片,清晰极了。

自此修复算是圆满结束。现在家里的几台电脑都在飞奔Back up。新买了几个6TB黑盘,不能浪费了...装满再说:P

结语:我以前经常因为硬盘损毁而丢失照片。所以用了Raid来保存照片。但显然我高估了Raid的数据安全能力,现在开始评测AWS的网络存储。不过最低等级的S3也很贵,毕竟我要存几十个T。希望大家多交流,也祝大家数据安安全全,没有像我一样的困扰。

另祝自己能够修复以前的三块硬盘(也是类似情况,现在鼓捣出来了,看看能不能顺带修复了。)

评分

参与人数 2积分 +9 收起 理由
商务车 + 5 感谢分享
gzrain + 4 偶对你的景仰如滔滔江水

查看全部评分

Advertisement
Advertisement

退役斑竹

发表于 2020-5-20 09:23 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
在等待期间,准备了另一块新硬盘,随时准备ddrescue。据说ddrescue要求一模一样的硬盘,找同一型号的费了一番功夫。

发表于 2020-5-20 09:45 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
raid几?我向来坚持raid1.这样的问题基本不会遇到

退役斑竹

发表于 2020-5-20 09:52 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
idog8818 发表于 2020-5-20 09:45
raid几?我向来坚持raid1.这样的问题基本不会遇到

之前没想到大容量硬盘Raid5会这么坑。现在先修复了再调整吧。Raid5看来只适合小容量硬盘。

退役斑竹

发表于 2020-5-20 09:52 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
主要单片修复时间过长,当另一片突然出问题掉线就垮了。

发表于 2020-5-20 09:54 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
5其实也很尴尬。。我曾经10都掉过数据,坏2盘资料全丢。从此以后只用1.别和我提容量减半。掉了数据就知道容量减半都是小事
Advertisement
Advertisement

发表于 2020-5-20 09:56 |显示全部楼层
此文章由 aqianer 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 aqianer 所有!转贴必须注明作者、出处和本声明,并保持内容完整
还是多做个冷备份更重要
听说过很多raid5掉盘,然后回复过程中又掉,数据全丢

发表于 2020-5-20 10:33 |显示全部楼层
此文章由 kane321 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kane321 所有!转贴必须注明作者、出处和本声明,并保持内容完整
家用千万别raid5,甚至raid 1也要有选择的用其实,多盘做备份就是了

发表于 2020-5-20 10:50 来自手机 |显示全部楼层
此文章由 berlindut 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 berlindut 所有!转贴必须注明作者、出处和本声明,并保持内容完整
idog8818 发表于 2020-5-20 09:24
5其实也很尴尬。。我曾经10都掉过数据,坏2盘资料全丢。从此以后只用1.别和我提容量减半。掉了数据就知道容 ...

raid10应该最安全啊,为啥坚持raid 1

发表于 2020-5-20 11:26 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
berlindut 发表于 2020-5-20 10:50
raid10应该最安全啊,为啥坚持raid 1

raid10追求速度和冗余。 我当时mirror的2个盘都坏了。那么数据就不完整了,全部数据损坏。我选择raid1,1个是简单,1个是2个可以算是单独的盘,有坏区也可以拉出正常数据,不至于全坏。我放弃了速度,我对传输速度要求不是那么高。100M/S足够我用了。



发表于 2020-5-20 11:32 |显示全部楼层
此文章由 Bomsori 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Bomsori 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我也想請問下樓主的事故是發生在公司嗎? 感謝!!
Advertisement
Advertisement

退役斑竹

发表于 2020-5-20 11:46 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
aqianer 发表于 2020-5-20 09:56
还是多做个冷备份更重要
听说过很多raid5掉盘,然后回复过程中又掉,数据全丢 ...

就是这样。按理说纯数学概率很低,但仔细想一下,少了一个硬盘,对其他硬盘的读写就会加倍,出错几率就会大。感觉这个情况挺普遍,打算以后都上Raid1, 别和我说容量减半,真的不是事儿。

退役斑竹

发表于 2020-5-20 11:47 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
idog8818 发表于 2020-5-20 09:54
5其实也很尴尬。。我曾经10都掉过数据,坏2盘资料全丢。从此以后只用1.别和我提容量减半。掉了数据就知道容 ...

非常赞同,也是吃一堑长一智吧。

退役斑竹

发表于 2020-5-20 11:49 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
kane321 发表于 2020-5-20 10:33
家用千万别raid5,甚至raid 1也要有选择的用其实,多盘做备份就是了

我看到Mwave有卖6个盘的duplicator...主要以前没有意识到还能批量坏...真的是连着掉线...崩溃了

退役斑竹

发表于 2020-5-20 11:50 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
berlindut 发表于 2020-5-20 10:50
raid10应该最安全啊,为啥坚持raid 1

我看有人说Raid6比Raid5好一点,但我觉得也是鸡肋?

退役斑竹

发表于 2020-5-20 11:52 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Bomsori 发表于 2020-5-20 11:32
我也想請問下樓主的事故是發生在公司嗎? 感謝!!

是personal的,公司数据备份得挺好,我自己的照片和录像,就想着Raid保全就好。没有想到啊...本来是怕平时用的电脑坏掉就麻烦了,结果Raid先坏了,尴尬。
Advertisement
Advertisement

发表于 2020-5-20 12:02 |显示全部楼层
此文章由 Bomsori 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Bomsori 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dingyipu 发表于 2020-5-20 11:52
是personal的,公司数据备份得挺好,我自己的照片和录像,就想着Raid保全就好。没有想到啊...本来是怕平 ...

感謝回應。Raid其實不是備份,是冗余裝置,是給「系統」用來提高可用度的。

「數據」防護還是要靠備份。不過各人使用上是否遵循定義似乎不用太糾結。

順便請教該事故之硬盤型號? 感謝!!

退役斑竹

发表于 2020-5-20 12:08 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Bomsori 发表于 2020-5-20 12:02
感謝回應。Raid其實不是備份,是冗余裝置,是給「系統」用來提高可用度的。

「數據」防護還是要靠備份。 ...

WD黄盘3TB,用了5年了,年底到保质期...

退役斑竹

发表于 2020-5-20 12:09 |显示全部楼层
此文章由 dingyipu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dingyipu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Bomsori 发表于 2020-5-20 12:02
感謝回應。Raid其實不是備份,是冗余裝置,是給「系統」用來提高可用度的。

「數據」防護還是要靠備份。 ...

现在都上黑盘了,希望好一点
头像被屏蔽

禁止发言

发表于 2020-5-20 12:12 |显示全部楼层
此文章由 汪汪汪 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 汪汪汪 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 汪汪汪 于 2020-5-20 12:13 编辑

重要数据绝对不用希捷。 尽量别用西数黑盘。血的教训。
多盘位的,,, 类似情况经常发生,说是坏一个没事,但是往往一坏就是一批。坏盘报错没那么及时!!!
头像被屏蔽

禁止发言

发表于 2020-5-20 12:14 |显示全部楼层
此文章由 汪汪汪 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 汪汪汪 所有!转贴必须注明作者、出处和本声明,并保持内容完整
黑盘是读写性能好而已,噪音发热不行。更重要的是轻微碰撞容易出问题。血的教训。后查了专业文章。
Advertisement
Advertisement

发表于 2020-5-20 12:18 |显示全部楼层
此文章由 lummar 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 lummar 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dingyipu 发表于 2020-5-20 11:52
是personal的,公司数据备份得挺好,我自己的照片和录像,就想着Raid保全就好。没有想到啊...本来是怕平 ...

现在硬盘越来越大,没坏块的可能性几乎是零。
个人用的话,RAID毫无必要,速度上没有提升,容量上有损失,可靠性不是提高而是降低。更大的问题在于,一旦出问题,修复时间难以预估,而且由于做RAID的盘多半是同一个型号同一批次的,要出问题,可能都有问题,所以往往修复的过程中看似是好的的盘也挂了,最终结果就是数据全灭。

庆幸之前看到过一个讨论RAID可靠性的论文,认真读完之后决定放弃RAID,家里NAS全是单盘,重要文件用脚本定时复制备份刀其它盘上。

不过到目前为止,运气还不错,硬盘没有坏的,就是被Orico的硬盘底座烧了一块的保险丝,还好数据没丢。

发表于 2020-5-20 12:19 |显示全部楼层
此文章由 lummar 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 lummar 所有!转贴必须注明作者、出处和本声明,并保持内容完整
汪汪汪 发表于 2020-5-20 12:12
重要数据绝对不用希捷。 尽量别用西数黑盘。血的教训。
多盘位的,,, 类似情况经常发生,说是坏一个没事 ...

运气问题吧。硬盘就那么几个牌子,我哪一个都用过的,就没有没出过问题的。
目前位置希捷还不错,最近WD比较坑
头像被屏蔽

禁止访问

发表于 2020-5-20 12:24 |显示全部楼层
此文章由 dlcat 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dlcat 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dlcat 于 2020-5-20 12:25 编辑

raid5非常坑,因为上的都是同一批次的硬盘,如果一块硬盘达到坏道过多无法mount的地步,大概率其他硬盘也坏道很多只是没有触发。

曾经我们有一批DELL的塔式服务器,3台在同一年坏了,和你情况类似,检测是一块坏报警,插新盘修复的时候其他的也陆续不行了,无法修复。

后来找了DELL和EMC中国大区的修复专家来,都没修复成功。

发表于 2020-5-20 12:54 |显示全部楼层
此文章由 Bomsori 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Bomsori 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dingyipu 发表于 2020-5-20 12:09
现在都上黑盘了,希望好一点

說到WD黑盤,我還有兩個2013年750G的現在還在用,剛開始的都是A檔貨,

後來就出問題了,真的很可惜。

感謝交流!!

发表于 2020-5-20 13:01 |显示全部楼层
此文章由 aqianer 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 aqianer 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dingyipu 发表于 2020-5-20 11:52
是personal的,公司数据备份得挺好,我自己的照片和录像,就想着Raid保全就好。没有想到啊...本来是怕平 ...

现在移动硬盘这么便宜,多做冷备份,照片和录像是多少钱都买不回来的
我的照片做了4个备份,2个nas,两个移动硬盘
Advertisement
Advertisement

发表于 2020-5-20 13:11 |显示全部楼层
此文章由 kawara 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kawara 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我都用Raid0,存不好找的老电影或电视剧。照片啥的都放云里

发表于 2020-5-20 13:20 |显示全部楼层
此文章由 go2home 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 go2home 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我早就说过,家用不要搞Raid,风险太高。重要数据云备份+冷备份。照片google cloud。现在的硬盘容量越来越大,Raid修复需要很长时间,家用NAS一般都没有硬Raid卡,所需时间更长。商用Raid一般都用2TB以下的硬盘做整列。Raid 5是最危险的。Raid出错最重要的是先备份数据,然后再做修复。

发表于 2020-5-20 13:37 |显示全部楼层
此文章由 上书房行走 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 上书房行走 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我曾经看专家说过。RAID的目的是保持服务器提供服务的延续性。这才是RAID的根本目的。很多用户都有误解。

因为RAID一般两块硬盘都差不多到年纪了,一块坏了 另一块很快就会跟上。就是给你时间缓冲来更换罢了。

如果为了备份,像群晖推出的那些备份工具,都很好用。就是把一块硬盘内容全盘备份到另一个。不用组RAID.
如如不动,是动中求静,如如不静,是静中求动,不可求大,不可求小,折中可生

发表于 2020-5-20 13:53 |显示全部楼层
此文章由 idog8818 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 idog8818 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 idog8818 于 2020-5-20 13:55 编辑

我做raid1用的是2快不同时间的盘,一般有2年差距,2年后第三盘把第一盘换掉。当1个盘出了问题的话,大多情况下换盘就解决了,很省事。重要资料还有1个移动硬盘冷备份,我不用网盘,太费事,需要的话还是多买个移动一盘就完事。



发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部