奇怪,我的HP GEN10 RAID6 有一个硬盘损坏,为何阵列不能访问了?(摸索清楚了,所有的疑问都得到答案)
刚才发现我广州的服务器(家里数据备份), 是使用6个8T的企业级硬盘组成RAID6 , 使用的是HP420阵列卡。有一个硬盘显示损坏了。 按道理,就算两个硬盘损坏, RAID 仍能访问的。
有谁知道原因?
注:下图的120G硬盘是系统SSD,跟阵列无关。
找一找2个x是哪2个叉。可能没有打开"允许阵列降级"。 wye11083 发表于 2023-1-13 06:18
找一找2个x是哪2个叉。可能没有打开"允许阵列降级"。
(引用自2楼)
两个错误都基本是一个意思。 我 生成 了阵列卡的诊断报告。 所有的数据都在里面能找到。
谁能帮忙找出原因?
armok. 发表于 2023-1-13 07:03
两个错误都基本是一个意思。
(引用自3楼)
好吧。那你找找设置,应该有一个允许raid降级的地方(p410有),打开就可以用了。关掉就是这样子保护模式了。 wye11083 发表于 2023-1-13 12:35
好吧。那你找找设置,应该有一个允许raid降级的地方(p410有),打开就可以用了。关掉就是这样子保护模式 ...
(引用自5楼)
按道理肯定允许的,否则raid就失去意义。
我认为应该不是这原因。
后记:4页配置9楼已经截图上传。没有看到,也不应能看到有硬盘损坏就不能使用raid的设置。 本帖最后由 neutronlmk 于 2023-1-13 15:30 编辑
所有不能访问的阵列,先检查温度。老司机也可能在这翻车。
还有一个可能是读写缓存坏了,拔掉缓存模块看看阵列是否正常。
我第一次玩阵列(还是上个月),就是缓存坏了设备管理里面能看到设备单用不了。系统也没提示哪里坏。
以为卡坏还是换了一次卡。
neutronlmk 发表于 2023-1-13 15:18
所有不能访问的阵列,先检查温度。老司机也可能在这翻车。
还有一个可能是读写缓存坏了,拔掉缓存模块看看 ...
(引用自7楼)
HP420卡在GEN 10 里,显示不出温度的。但在GEN8 与 GEN7 却可以。
当时我的解决方法,是淘宝买了一个双路的USB温度采集器,安装在服务器的RAD卡CPU与电容附近。
目前的温度很正常:
缓存坏了,关闭缓存就行(虽然慢点)目前的状态就是已经关闭了缓存(应该是自动关闭的,之前正常的时候是打开的)
HP420的配置有4页, 我都截图上来,没有看到有硬盘损坏就不能使用RAID的设置项(也不应该有)。 wye11083 发表于 2023-1-13 12:35
好吧。那你找找设置,应该有一个允许raid降级的地方(p410有),打开就可以用了。关掉就是这样子保护模式 ...
(引用自5楼)
允许raid降级是在软件中设置么?
在BIOS中是否也要有相应设置呢? armok. 发表于 2023-1-13 15:37
HP420卡在GEN 10 里,显示不出温度的。但在GEN8 与 GEN7 却可以。
当时我的解决方法,是淘宝买了一个双 ...
(引用自8楼)
每个硬盘的温度最好都能监测? neutronlmk 发表于 2023-1-13 15:18
所有不能访问的阵列,先检查温度。老司机也可能在这翻车。
还有一个可能是读写缓存坏了,拔掉缓存模块看看 ...
(引用自7楼)
你用的raid卡是什么型号? Franso 发表于 2023-1-13 15:56
每个硬盘的温度最好都能监测?
(引用自11楼)
现在硬盘显示还有5个是正常的。硬盘的温度都不高,不到50度(这种企业级的机械硬盘,100度都可以持续工作的)。
armok. 发表于 2023-1-13 16:14
现在硬盘显示还有5个是正常的。硬盘的温度都不高,不到50度(这种企业级的机械硬盘,100度都可以持续工作 ...
(引用自13楼)
点击子项,右侧是否有更详细信息?
armok. 发表于 2023-1-13 16:14
现在硬盘显示还有5个是正常的。硬盘的温度都不高,不到50度(这种企业级的机械硬盘,100度都可以持续工作 ...
(引用自13楼)
是看阵列卡的温度;
还有可以把掉缓存来测试,拔掉不影响读写数据,先排除缓存有无问题。 neutronlmk 发表于 2023-1-13 16:39
是看阵列卡的温度;
还有可以把掉缓存来测试,拔掉不影响读写数据,先排除缓存有无问题。 ...
(引用自15楼)
阵列的温度在8楼。这个阵列卡,我额外加装了2个散热风扇的。 armok. 发表于 2023-1-13 15:46
HP420的配置有4页, 我都截图上来,没有看到有硬盘损坏就不能使用RAID的设置项(也不应该有)。 ...
(引用自9楼)
启用降级模式性能优化试一下? 我记得好像还有其它设置的,包括阵列卡设置、阵列设置、磁盘设置等(P410都有一堆设置项,P420应该差不了多少)。 wye11083 发表于 2023-1-13 21:16
启用降级模式性能优化试一下? 我记得好像还有其它设置的,包括阵列卡设置、阵列设置、磁盘设置等(P410都 ...
(引用自17楼)
HP420 跟GEN10 不太配套的。 电脑开机,无法进入 HP420的 BIOS管理界面的(GEN7, GEN8可以)。 这个阵列还是进入WIN7后,在WIN7下面才建立的。
已经将该降级选项选中。 重启了电脑。看看行不行。
armok. 发表于 2023-1-13 21:51
HP420 跟GEN10 不太配套的。 电脑开机,无法进入 HP420的 BIOS管理界面的(GEN7, GEN8可以)。 这个阵列还 ...
(引用自18楼)
重启后不行。 检查配置,又回到禁用的状态。
将备用不一致性修复策略也改为启动。再重启试试,
没用。重启电脑后,上述两个配置又恢复到已禁用状态。 RAID盘仍是看不到。 armok. 发表于 2023-1-13 22:08
没用。重启电脑后,上述两个配置又恢复到已禁用状态。 RAID盘仍是看不到。 ...
(引用自20楼)
没想到还有这种事情发生。 armok. 发表于 2023-1-13 22:24
没想到还有这种事情发生。
(引用自21楼)
没有应用配置?改了选项直接重启肯定不行,需要在最下面?还是最上面右边应用一下。按道理应该不至于这么拉。我前几年的p410,raid6挂了俩盘还在正常工作,有一天看到之后吓坏我了。。后来ssd,机械降价之后就没有再折腾了。 wye11083 发表于 2023-1-13 22:45
没有应用配置?改了选项直接重启肯定不行,需要在最下面?还是最上面右边应用一下。按道理应该不至于这么 ...
(引用自22楼)
保存按钮就提示已经应用了。
没有其他地方应用按钮。 armok. 发表于 2023-1-13 22:51
保存按钮就提示已经应用了。
没有其他地方应用按钮。
(引用自23楼)
那看来可能得亲自跑一趟了。。 wye11083 发表于 2023-1-13 22:58
那看来可能得亲自跑一趟了。。
(引用自24楼)
我下次去广州,从东莞搬一台GEN7 过去(我有一台后备的),直接将阵列换到GEN7上。GEN10 不用了。 neutronlmk 发表于 2023-1-13 16:39
是看阵列卡的温度;
还有可以把掉缓存来测试,拔掉不影响读写数据,先排除缓存有无问题。 ...
(引用自15楼)
硬盘的温度是否比阵列卡温度更重要? armok. 发表于 2023-1-13 22:08
没用。重启电脑后,上述两个配置又恢复到已禁用状态。 RAID盘仍是看不到。 ...
(引用自20楼)
硬盘拆下来,用HDTune看下SMART数据? Franso 发表于 2023-1-14 11:55
硬盘拆下来,用HDTune看下SMART数据?
(引用自27楼)
没有什么价值的建议。这是raid。 Franso 发表于 2023-1-14 11:52
硬盘的温度是否比阵列卡温度更重要?
(引用自26楼)
没有价值点意见。这是raid。硬盘如果果然会报警,raid会提示硬盘错误。 机器从广州运回东莞了。打开,发现有个硬盘发出异响,拆下。但机器还是无法识别阵列。
淘宝买970,但店家年初8才上班。
之后到京东1109元买了一只。
明天到。
换上去看看怎么回事。
armok. 发表于 2023-1-24 14:39
淘宝买970,但店家年初8才上班。
之后到京东1109元买了一只。
(引用自31楼)
当心重建RAID的时候把其它盘搞挂了 brother_yan 发表于 2023-1-24 17:15
当心重建RAID的时候把其它盘搞挂了
(引用自32楼)
也是没有办法的事情了。
目前5个硬盘无法使用。还有什么办法?
还真有一个办法,我找了一台GEN7备用机器,里面也有HP420阵列卡。
我将这5个8T硬盘拆过去,看看能否正常。 在GEN7 上接上5个8T硬盘。
开机自检,我本来在这里期待看到提示:倒入之前的阵列配置数据,然后就可以识别回来原来的阵列。
但竟然没有出现。只好按F8 进入阵列卡的bios界面(这个界面GEN10机器无法进入的)
提示以下警告 。无法做任何操作,只能退出。
进入到Windows后,当然是看不到任何阵列的配置信息了:
没有任何办法,只能等明天新买的硬盘到货,接回到原来的GEN10 机器上,看看是否有奇迹。
按F8
本帖最后由 brother_yan 于 2023-1-24 18:58 编辑
armok. 发表于 2023-1-24 18:46
在GEN7 上接上5个8T硬盘。
开机自检,我本来在这里期待看到提示:倒入之前的阵列配置数据,然后就可以识别 ...
(引用自34楼)
硬盘标号了么,看你发的图片没有记号,最后一张图好像硬盘顺序弄乱了。。。
找RAID硬盘顺序我看过一个有意思的方法:阵列恢复大师https://github.com/USTC-Hackergame/hackergame2021-writeups/blob/master/official/%E9%98%B5%E5%88%97%E6%81%A2%E5%A4%8D%E5%A4%A7%E5%B8%88/README.md,供娱乐。。。 brother_yan 发表于 2023-1-24 18:57
硬盘标号了么,看你发的图片没有记号,最后一张图好像硬盘顺序弄乱了。。。
找RAID硬盘顺序我看过一个有 ...
(引用自35楼)
标号了。前面4个硬盘肯定是对的,后面一个因为有个硬盘坏了,所以可能插错了。
我以前测试过阵列恢复,好像没有必要按顺序的。难度我记错了?
将5个硬盘插回GEN10, 在Win117下,看到这个阵列raid6 仍然存在。
有必要再将音硬盘移到GEN7, 并纠正刚才的顺序?
或索性等明天硬盘到,插入新硬盘到GEN10上,希望有好运气。
我现在感觉后一种可能稳妥一些。
如果插入新硬盘,没有任何动作,再移到GEN7上碰碰运气。
感觉怎样? armok. 发表于 2023-1-24 19:34
标号了。前面4个硬盘肯定是对的,后面一个因为有个硬盘坏了,所以可能插错了。
(引用自36楼)
我没实操过RAID,不瞎出主意了。。。你的思路不错。很感兴趣为什么RAID6丢一个盘不能用,期待后续 brother_yan 发表于 2023-1-24 20:07
我没实操过RAID,不瞎出主意了。。。你的思路不错。很感兴趣为什么RAID6丢一个盘不能用,期待后续 ...
(引用自37楼)
很感兴趣为什么RAID6丢一个盘不能用?
这是我非常失望的。
当初建raid太自信了,没有将任意2个盘拔掉测试(Dell服务器我就做过这样的测试)。
京东的新硬盘到了:
左边的是坏掉的硬盘,右边的是新买的。一个2020年,一个2022年生产:
坏硬盘年初8寄给淘宝供应商维修,序列号这里记录一下:
我在角落位置写了一个铅笔的M字,看看到时是维修还是换新盘:
莫大,是换个新硬盘就恢复了吗? GEN10 原机只能放4个硬盘,我扩展了2个。
刚才看了一下,扩展的第一个硬盘接在阵列0,另外一个接在2的位置(这个坏了)。
一开机就有好消息,下面这个BIOS自检界面,故障的时候要好几分钟才能过去,现在很快就过去,快得最后有没有出现“1个逻辑阵列发现”我都没有看清楚。
进入Windows,打开“我的电脑”,哈哈,阵列D盘出来了!!!
进入P420管理器,看到出错已经消失,提示:正在重建硬盘。
这台机器如果数据读不出来,会被老婆说一辈子,因为我将她的手机图片全部放在这个机器上。
而由于太过信任RAID6, 我甚至懒得跟东莞家里的服务器同步数据.....
幸亏修好。
但我现在仍然非常不解:为何损坏一个硬盘,阵列就完全无法使用了?
如果找不到答案,我只能在数据备份好之后,更换掉这一块P420卡。
我公司仓库还有几十块旧服务器硬盘(升级留下来的),可以做详细的测试。 armok. 发表于 2023-1-25 13:28
这台机器如果数据读不出来,会被老婆说一辈子,因为我将她的手机图片全部放在这个机器上。
而由于太过信任 ...
(引用自42楼)
既然能读出数据,可以先暂停重建,先把数据备份一下更稳妥 brother_yan 发表于 2023-1-25 14:22
既然能读出数据,可以先暂停重建,先把数据备份一下更稳妥
(引用自43楼)
没事,重建非常安全,肯定不会出问题。这个不用怀疑。
数据量非常大,估计要几天才能同步到另外一台机器上。 重建了一天,还是0%,这个数据肯定没有更新。
这块P420在GEN10上怪怪的。(之前发现卡上的两个温度显示不了,阵列卡的开机BIOS也进不了)。
再等一个晚上。明天看看情况。 armok. 发表于 2023-1-26 00:22
重建了一天,还是0%,这个数据肯定没有更新。
这块P420在GEN10上怪怪的。(之前发现卡上的两个温度显示不 ...
(引用自45楼)
可以下结论了,HP420 卡在GEN10 上,可以建立Riad6,可以正常使用。
但当有一个硬盘发生故障,整个Riad就无法被操作系统识别。
重新插入新硬盘,整个Riad可以被操作系统识别,可以读写数据。
但是,新硬盘无法同步数据。
也就是说,如果继续使用,这个raid只能带病工作(有一个硬盘没有同步数据)...
看来导出数据后,要重新购买一块raid卡了。 之前第5,第6个硬盘,是硬塞到机器的内部空位。
坏的硬盘修好之后,我就有7个硬盘了。机器内部再也放不下。
索性京东自营买了2个2位的硬盘笼(可以堆叠成4位)。将原本塞在机器里面的2个硬盘放到机器外面。
我花了1小时完成了这个工作:
准备备份数据出来。备份完,要物色一块新的raid卡了,要求是半高的。
大家有推荐吗? GEN10 只有8G内存,顺便多买一条,升级到16G 搭车求推荐一个好点的直通卡,准备新上一台freenas的存储 huangdog 发表于 2023-1-26 13:33
搭车求推荐一个好点的直通卡,准备新上一台freenas的存储
(引用自50楼)
freenas不要上RAID卡,推荐上PCIE-SATA卡,然后上RAIDZ2文件系统。 未来可能换windowed存储或者其他系统,所以想找个支持直通的卡,未来可玩性高一点,将来切r5或者r6的阵列也行 armok. 发表于 2023-1-26 12:42
准备备份数据出来。备份完,要物色一块新的raid卡了,要求是半高的。
大家有推荐吗? ...
(引用自48楼)
Adaptec ASR-5805 这块半高的阵列卡看起来非常不错,但价格让我迷惑(4楼:求证实,没有电池性能不会降低) https://www.amobbs.com/forum.php?mod=viewthread&tid=5775374 三台文件服务器搬到一起,同步数据。
因为数据量太大,分散式分布同步数据有点麻烦,所以2年前就没有同步了。每天机器每天都只是备份自己的数据。
开始同步数据.
我使用的是局域网,这样速度快。
使用robocopy,而不是xcopy。
目标文件比较新,就不要备份了。
备份到现在,才备份了700G
看来还要备份2天2夜。
这系统其实很可靠。最怕备份了一会系统就出错。
tsb0574 发表于 2023-1-26 15:04
freenas不要上RAID卡,推荐上PCIE-SATA卡,然后上RAIDZ2文件系统。
(引用自51楼)
你用过freenas的软raid6么{:biggrin:} Franso 发表于 2023-1-27 11:26
你用过freenas的软raid6么
(引用自57楼)
软raid就算了,心理安慰而已 昨天到现在刚好24小时。
已经备份了3T数据。
其它数据无关紧要,备份完今晚就可以结束。
armok. 发表于 2023-1-27 11:38
软raid就算了,心理安慰而已
(引用自58楼)
ZFS的文件系统还可以相信的,并且不存在诸多硬Raid的限制,并且可以设置多份校验,比如ZFS Z2就可以3块盘做校验。 Franso 发表于 2023-1-27 11:26
你用过freenas的软raid6么
(引用自57楼)
装了台8*16T盘NAS,用的是ZFS Z2类似于RAID6的 GEN10的数据已经全部备份出来,可以放心折腾这个阵列了。
将6个硬盘拆出来,安装到GEN7上。这一次严格按照顺序安装。
P420 的BIOS在GEN7可以正常进入,提示阵列正在重建,但没有进度百分比。
于是进入win7,看到了重建的百分比了。
P420的三个温度数据也能看见(GEN10看不到这3个温度)
armok. 发表于 2023-1-26 12:36
可以下结论了,HP420 卡在GEN10 上,可以建立Riad6,可以正常使用。
但当有一个硬盘发生故障,整个Riad ...
(引用自46楼)
这个结论在我使用GEN7测试后,得到了实锤。 tsb0574 发表于 2023-1-27 23:43
装了台8*16T盘NAS,用的是ZFS Z2类似于RAID6的
(引用自61楼)
这么多盘位,你用的什么机箱,可以塞入这么多硬盘{:biggrin:} Franso 发表于 2023-1-28 00:39
这么多盘位,你用的什么机箱,可以塞入这么多硬盘
(引用自64楼)
托普龙8*3.5机箱啊,专门的NAS机箱 Franso 发表于 2023-1-28 00:39
这么多盘位,你用的什么机箱,可以塞入这么多硬盘
(引用自64楼)
这种原装机器上拆下来的12盘位的硬盘笼子,价格真香。能找到类似的支持raid6吗? https://www.amobbs.com/forum.php?mod=viewthread&tid=5775421 刚才联系淘宝硬盘供应商,竟然说,2020的硬盘需要返厂。需要一到两个月。
我的天!幸亏我当机立断,在京东买了一个全新的。
armok. 发表于 2023-1-28 00:16
GEN10的数据已经全部备份出来,可以放心折腾这个阵列了。
将6个硬盘拆出来,安装到GEN7上。这一次严格按照 ...
(引用自62楼)
大概花了一天多时间做完重建。再花了2天做奇偶校验。
刚才终于看到没有故障的阵列了:
armok. 发表于 2023-1-28 23:42
刚才联系淘宝硬盘供应商,竟然说,2020的硬盘需要返厂。需要一到两个月。
我的天!幸亏我当机立断,在京东 ...
(引用自67楼)
这个返厂是啥情况?召回维修?特定的批次有问题吗? 看来不能买Dell和HP这样厂家集成的Raid卡,要买第三方的卡。 tsb0574 发表于 2023-1-31 08:46
看来不能买Dell和HP这样厂家集成的Raid卡,要买第三方的卡。
(引用自70楼)
的确是的。
以后尽量买adaptec。 zchong 发表于 2023-1-31 07:28
这个返厂是啥情况?召回维修?特定的批次有问题吗?
(引用自69楼)
店家说2020年的盘要返厂,最近买的可以直接换新。估计是维修政策。
2个月才收到,太没劲了。看来还是京东自营好,估计京东自营会直接换货或退款。 armok. 发表于 2023-1-24 14:35
机器从广州运回东莞了。打开,发现有个硬盘发出异响,拆下。但机器还是无法识别阵列。
(引用自30楼)
历时一个半月,终于收到硬盘。
2022年11月生产的,感觉应该是给我换了全新的硬盘了。包装也是全新的。
不管了,拆开测一次mhdd先!
本来想将这硬盘加入阵列。计算后发现加不了。除非我格式化阵列为族大小16K才行。
https://www.amobbs.com/forum.php?mod=redirect&goto=findpost&ptid=5776127&pid=12019593 新收到的8T硬盘mhdd扫描结果:
我一步到位把簇大小改到64K neutronlmk 发表于 2023-3-12 23:15
我一步到位把簇大小改到64K
(引用自76楼)
可以先计算。
比如8T, 8个硬盘,raid6,组成48T,格式化的时候,必须使用16k 。
我当年是6个8T 组成了大概30T, 族大小选择“自动”,系统给我分配成8K.
而8k 最大只能支持32T, 也就是说,我已经无法再增加硬盘。
这次又吃了没有文化的亏了。
页:
[1]