新足迹

 找回密码
 注册

精华好帖回顾

· 悉尼穷人买房记(更新完毕,并添片片了) (2009-11-29) 天涯浪客 · DIY 白蚁防治--92#有升级版,感谢LIAOTANG (2010-11-24) hsqhugh
· 带你走近雷诺-科雷傲 暨提车作业(Renault_Koleos_Bose_Auto_2.0 Diesel 4WD)-精华啦! (2013-7-20) relaxchair · Building Albany 40 with Carlisle in Somerfield, Keysboroug-Carlisle很负责,是个好builde (2011-5-23) cathrine_fu
Advertisement
Advertisement
查看: 2103|回复: 25

存储老大请进 [复制链接]

发表于 2010-10-21 22:36 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
下午POWER CYCLE IBM DS4500后,1块SATA硬盘在STORAGE MANAGER上显示为空白,无法识别。硬盘指示灯无异常(绿),HOTSWAP盘没有TAKE OVER。ARRAY 依然OPTIMAL。
求教可能的原因?谢谢(paopaobing(58))
Advertisement
Advertisement

发表于 2010-10-22 13:55 |显示全部楼层
此文章由 koyuu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 koyuu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有log么? Raid Level 是多少呀?有可能是hardware issue 咯 有保修没 省事的办法就是 call  1800 819 426  假定你在澳洲。

自己研究的话LZ 可以在国内的 CU ,LU, Dostor,上面发帖 相信会得到跟多的帮助。

发表于 2010-10-22 14:34 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
18人找不到原因,不过算是解决了。 硬盘挂了。。还好没数据丢失。。

2010年度奖章获得者

发表于 2010-10-22 14:46 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
坏得好奇怪, 怎么 array 会还是optimal? Hotspare 不take over倒是常有的事. 看着好象IBM Storage Manager Client没有正常显示似的.

当时硬盘还有activity指示吗?

发表于 2010-10-22 15:03 |显示全部楼层

回复 4# 的帖子

此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
是很奇怪,显示灯正常,不过应该是没ACTIVITY(不闪动)只有在SM上看到空白盘一样的。因为所有的LPAR都SHUTDOWN了,所以不知道这个是不是ARRAY STILL OPTIMAL的原因。。本来是弄P5 FIRMWARE升级的,很久没给DS做POWER CYCLE了,结果动一下就出问题。。

[ 本帖最后由 xyan1 于 2010-10-22 16:05 编辑 ]

2010年度奖章获得者

发表于 2010-10-22 15:47 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
那我倒也遇到过, 如果不是象其他硬盘一样有activity指示就肯定是硬盘的问题了, 如果这样的话其实倒可以拔出来reseat 一下看看, (一般如果array 还 optimal的话不能拔出来, 怕硬盘还没完全坏, 还有activity, 如果还在往这个硬盘写数据一拔搞不好把array 搞坏就惨了. 这种时候要force offline 那个硬盘).

评分

参与人数 1积分 +2 收起 理由
xyan1 + 2 谢谢奉献

查看全部评分

Advertisement
Advertisement

发表于 2010-10-22 17:40 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
array optimal时候没做任何拔插动作,manual failed disk。。。拔,插,array degraded...hot swap仍然没用。。没办法了只好又关掉,重新加电。
最后还是不知道什么导致的。。关电源的顺序?还是因为硬盘还在SPINNING(LPAR已经SHUTDOWN)时候就关电源导致的?

2010年度奖章获得者

发表于 2010-10-22 18:52 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
可能是HDD firmware 的原因, 你的drive modle 是什么? 什么firmware level ?

发表于 2010-10-22 18:59 |显示全部楼层
此文章由 frankielynna 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 frankielynna 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有保修吗?打ibm hotline 13xxxx,送个log就可以知道原因了。

评分

参与人数 1积分 +1 收起 理由
xyan1 + 1 谢谢奉献

查看全部评分

发表于 2010-10-22 19:46 |显示全部楼层
此文章由 koyuu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 koyuu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
呵呵 说个题外话 power cycle DS4500 应该不是 part of this change吧 升级IBM小机 firmware 最好不要和其他change在一起 存储还是少动 省的麻烦 万一起不来 又是 production的话 那就刺激了....

评分

参与人数 1积分 +2 收起 理由
xyan1 + 2 我很赞同

查看全部评分

发表于 2010-10-22 20:01 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
原帖由 JuJu 于 2010-10-22 19:52 发表
可能是HDD firmware 的原因, 你的drive modle 是什么? 什么firmware level ?

周1去公司看看。。。
Advertisement
Advertisement

发表于 2010-10-22 20:01 |显示全部楼层

回复 9# 的帖子

此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
他们没定论。。基本就是搞不清

发表于 2010-10-22 20:04 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
原帖由 koyuu 于 2010-10-22 20:46 发表
呵呵 说个题外话 power cycle DS4500 应该不是 part of this change吧 升级IBM小机 firmware 最好不要和其他change在一起 存储还是少动 省的麻烦 万一起不来 又是 production的话 那就刺激了.... ...

不是PROD,是DR。呵呵。不过已经挺刺激了。主要是OUTAGE一次不容易,这次吸取经验了。。

发表于 2010-10-22 20:10 |显示全部楼层
此文章由 frankielynna 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 frankielynna 所有!转贴必须注明作者、出处和本声明,并保持内容完整
原帖由 koyuu 于 2010-10-22 20:46 发表
呵呵 说个题外话 power cycle DS4500 应该不是 part of this change吧 升级IBM小机 firmware 最好不要和其他change在一起 存储还是少动 省的麻烦 万一起不来 又是 production的话 那就刺激了.... ...


这个说的对,change 一个一个做,每个都走流程让客户批,做出事情大家一起担责任。
准备的时候,backup方案要想周全了,down time也申请的长1点,以防万一。

发表于 2010-10-22 20:20 |显示全部楼层
此文章由 sun2012 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 sun2012 所有!转贴必须注明作者、出处和本声明,并保持内容完整
和HDD的firmware应该没关系。。。

另外轻易不要power off DS,除非确实有必要。。。

2010年度奖章获得者

发表于 2010-10-22 20:22 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
SATA HDD 有些有known issue, 看看这个是不是你的问题,

SATA drive hangs or is not ready after power cycle - IBM Disk Systems


Applicable countries and regions
--------------------------------------------------------------------------------

SourceRETAIN tip: H194697

SymptomAfter a power cycle, the Serial Advanced Technology Attachment (SATA) hard drive is no longer available and becomes unresponsive. This RETAIN tip is related to specific 3.5-inch SATA hard drives to prevent the hard drive from hanging or becoming not ready after power cycle.

Affected configurationsThe system may be any of the following IBM Servers:

DS4200 Storage Server, Type 1814, any model
DS4700 Storage Server, Type 1814, any model
DS4800 Storage Server, Type 1815, any model
DS5100 Storage Controller, Type 1818, any model
DS5300 Storage Controller, Type 1818, any model
IBM System Storage DS3200, Type 1726, any model
IBM System Storage DS3300, Type 1726, any model
IBM System Storage DS3400, Type 1726, any model
The system is configured with one or more of the following IBM Option part numbers:

1000 GB 7200 rpm SATA E-DDM, Option part number 44X2458, replacement part number (FRU) 44X2459
500 GB 7200 rpm SATA E-DDM, Option part number 39M4554, replacement part number (FRU) 39M4557
DS4200 1000 GB 7200 rpm SATA EV-DDM, Option part number 44X2454, replacement part number (FRU) 44X2455
DS4200 500 GB SATA EV-DDM, Option part number 42D0389, replacement part number (FRU) 42D0392
DS4200 750 GB 7200 rpm SATA II EV-DDM, Option part number 43W9738, replacement part number (FRU) 43W9720
The level BB10 firmware for the SATA hard drive is affected.

This tip is not Operating System specific.

SolutionTo determine the hard drives model, use the IBM DS Storage Manager or the label on the hard drive. Firmware level BB10 on the following models are affected:

ST31000340NS
ST3250310NS
ST3500320NS
ST3750330NS
For System Storage DS3000 products, the Fix is available from the "IBM DS3000 SAS / SATA HDD Update Pack v4.5" or later.

For System Storage DS4000 and DS5000 products, the Fix is available from the "IBM DS ESM and HDD firmware bundle version 1.61" or later.

Either of these can be found under the specific IBM System Storage Product at the following support web site:

IBM System Support
IBM strongly recommends applying this firmware update to prevent this issue.

As always, IBM recommends backing up all data before applying hard drive firmware updates.


WorkaroundUsers can limit their exposure to this issue by limiting the number of power cycles performed or avoiding power cycles completely.

Additional informationThis rare condition is caused by a hard drive firmware issue that allows the hard drive's "event log" pointer to be set to an invalid location.

This condition is detected by the hard drive during power up, and the hard drive goes in to failsafe mode to prevent inadvertent corruption. As a result, once the failure has occurred, the user's data becomes inaccessible.

The condition only occurs after a power cycle and not during runtime. Therefore, avoiding or minimizing power cycles will greatly reduce the chances of SATA hard drives becoming inoperable after a power cycle.

If this event occurs on multiple SATA hard drives in the same array, it can cause loss of access.

Applicable countries and regions
Worldwide

Document id:  MIGR-5079399
Last modified:  2010-10-13

评分

参与人数 1积分 +8 收起 理由
bulaohu + 8 谢谢奉献

查看全部评分

Advertisement
Advertisement

2010年度奖章获得者

发表于 2010-10-22 20:26 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
koyuu 说得对, 存储设备能不power cycle 尽量不要power cycle.

发表于 2010-10-22 20:27 |显示全部楼层
此文章由 sun2012 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 sun2012 所有!转贴必须注明作者、出处和本声明,并保持内容完整
问IBM,不问白不问,而且还不用你承担责任。。。

发表于 2010-10-22 20:36 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
to Juju & koyuu

这次做POWER CYCLE的原因是,几个月前系统报 battery不能100% charge,18的人拒绝更换电池,建议做POWER CYCLE,当时一直没有机会。这次想着顺便弄了。。。。结果出问题了。
18存储的SUPPORT实在不咋的,这2天PROD,DR坏了2块盘,PROD的等了2天才收到新的。。MD好歹也是CRITICAL CALL。。。

2010年度奖章获得者

发表于 2010-10-22 20:40 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这个太差了, 不是应该4hrs 吗?

发表于 2010-10-22 20:44 |显示全部楼层
此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
对呀,很慢很慢。。一会说没PARTS,要从SYD调。。。(paopaobing(45))
Advertisement
Advertisement

发表于 2010-10-22 22:50 |显示全部楼层
此文章由 koyuu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 koyuu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
IBM 在澳洲的备件管理很差的,上次是一个5802 IO 柜的电源模块坏了 全澳洲都out of stock  还得从美国调 又是 Easter假期 等了差不多半个月呢

发表于 2010-10-25 09:19 |显示全部楼层

回复 16# 的帖子

此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Hi JuJu,

It shouldn't be this problem..we're using Maxtor 250G 7200 RPM hdd...

2010年度奖章获得者

发表于 2010-10-25 13:50 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
what's the fiirmware lever on the SATA disk?  If it is BB10, 250GB 7.2k RPM ones are also affected...

2010年度奖章获得者

发表于 2010-10-25 14:02 |显示全部楼层
此文章由 JuJu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JuJu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果不是这个就让support提供root cause analysis, 不是换一个硬盘就ok了,总得分析下怎么会这样.

评分

参与人数 1积分 +2 收起 理由
xyan1 + 2 thanks for ur help through this case..

查看全部评分

发表于 2010-10-25 15:19 |显示全部楼层

回复 25# 的帖子

此文章由 xyan1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xyan1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
got new drive today.
as the causes, we're working on it...thanks mate.
Advertisement
Advertisement

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部