专门开一贴,群晖硬软件的的各种坑及解决方案

本帖最后由 spacer 于 2020-11-8 13:30 编辑

在 Chiphell这么久了,也希望能对大家有点贡献,作为一个白群晖6年的老用户,大家都说群晖是买软件送硬件,那么这么多年来给群晖捐了不少“软件授权费”,DS415+,DS216,DS916+,DS1819+,DX517,RX418,也一直给 synology 做反馈,但最近 DSM7.0延期,6.X 很多反人类的逻辑客服都不愿意修正了,只能自己鼓捣。决定在这里发个帖子,希望能够帮助到大家避开可能的各种坑。 不知道这些坑在“不远”的 DSM 7.0 中是否会修正...
适用对象:   白群晖用户,不愿意折腾,对数据敏感性较强(装了很多家庭照片,文件,宝贵的**姐们);
不适用对象:黑群用户,有些问题会涉及到硬件,由于黑群配置差异极大,很难找到原因;
最后更新日期: 2020 年 10 月 4 日 (以群晖的牙膏性,这篇文章应该在未来2年都不会过时)



不折腾玩转群晖NAS,苦口婆心的避坑建议:

  • 多花点钱买企业级硬盘,尽量不要用普通硬盘,尤其是淘汰下来的N 年旧硬盘做 NAS;

  • **姐有价,数据无价,如果真的想要保护数据,仅靠NAS是不够的,RAID而是用来保证某硬盘损坏时候依然能提供相关服务,而不是用来保证数据不丢的。为了数据安全,切记使用“3-2-1”法则保证数据安全。否则接收开盘数据恢复价格1T=1k;

2盘位篇
如果想不折腾,数据又很重要,不建议使用Basic模式

背景:大部分首次买白群晖的的小白们首选的都是 2 盘位的机器,一般领导给的预算也不太足,配上2个4T硬盘回家是常见的配置。回来插上硬盘一直点下一步,就被默认做成 SHR阵列。一看怎么使用空间才 3.7T,欲哭无泪,然后跑上 chiphell,在各种帖子的指引下,切换成 Basic 模式,然后以为从此高枕无忧...Basic 的确增加了可使用空间,但是要注意以下几点:

  • Basic模式下的坑:磁盘损毁后的数据备份操作极其复杂:首先,群晖的磁盘损毁判断机制设定的阈值非常高,只要有少量几个块出现读写缓慢,就会自动将此硬盘设定为“磁盘损毁”,但是群晖平时SMART自检又特别的松,基本上不糊提示。本人好几个盘损毁,但上台式机检查,都没有任何问题。另外群晖经常会出现莫名其妙的“掉盘”现象,就是突然提示硬盘已拔出。在这种情况下,如果是 shr 或者 raid,直接重新插进去就可以了,但是 basic 模式下,这块盘的数据就只能上 linux系统去恢复,这个操作对于小白来说难度比较大,另外还有一种办办就是把盘插回去,然后用 ssh的 mdadm命令强行修复,可以强行把这个盘让群晖认出来,但需要一定的 linux 知识(参考 这个帖子 和 这个帖子),我就不展开说了,有需要以后单独开一贴。

  • Basic模式下的坑:App数据的问题:群晖的系统是每个盘都有一个备份的,但是APP和相关数据是仅放在一个存储空间里的(包括 download station,moment 的照片索引数据),在硬盘没有问题的情况下,可以通过“套件中心”-“常规”-“默认存储空间”进行修改。但是如果 basic 模式,存放 app 数据的那块硬盘挂了,你就会发现此时无法修改 app 的默认存储空间,如果不具备一定 linux 知识(通过 madam 强行修复),极大概率这些索引数据就没有了,几年的照片索引分类就白做了。

  • 2盘位的硬盘建议:如果实在预算有限,需要 Basic模式扩展容量,那建议买两块企业盘,不要买普通红盘!不要买普通红盘!不要买普通红盘。红盘出故障的概率+群晖自动掉盘机制设定,一次折腾就会让你痛不欲生(数据不会掉,但是很蛇藤)。实在不行,确保盘位 1 的是企业级硬盘,然后将套件中心的默认存储空间放在盘位 1。如果预算足够,可以考虑购买的时候直接上2块 8T/12T 做成 SHR,价格目前也不错,基本上能撑 3-5 年的日常使用,不怎么出问题了。

  • Basic 和SHR转换:Basic 是支持直接升级为 SHR 的,反之不行。如果你目前已经做的是 Basic 模式,需要转换 SHR(两盘位相当于 RAID 1),你要做的就是把一个盘位的数据 copy 到移动硬盘里,或者拷贝到另外一个盘里,然后关机,卸下一个硬盘,装新的大硬盘,开机后就可以选择升级为 SHR,参考官方的教程。但是注意,你这么做硬盘容量是没有增加的,参考官方存储容量计算器。比如你 4TB basic - 2T(A)+2T(B) ,升级为2T(A) + 8T shr后,实际可用容量反只有 2TB。需要再操作一遍,把 2T(A) 的数据移到8T,然后再把 2T(A)更换成 8T,这样最终才能有 8T 的容量。


4盘位篇
RAID 与数据安全

背景:很多人买 4 盘位的机器,很多人默认是做 RAID(RAID5/SHR)。从数据安全的角度,采用消费级硬盘做RAID5有一定的重建失败率,需要注意这个坑。

  • 首先 RAID 不是用来保证数据不丢的,而是用来保证硬盘损坏时候依然能提供相关服务。为了数据安全,切记使用“3-2-1”法则保证数据安全

  • 在有冷备份数据的情况下,群晖下做SHR 比Basic要省心的多,但是呢,消费级硬盘与企业级硬盘相比,在 RAID 损毁的时候,重建有一定概率失败,导致整个阵列挂掉(计算器)。其实,这个风险是由于操作不正确引起的。永远记住,群晖 RAID 提示存储空间降级后,第一时间,找个移动硬盘,把所有数据拷出来,然后再换盘重建。我看论坛上各种血泪帖子,都是在没有数据备份的情况下,贸然重建引起的。

待补充


nvme SSD 缓存与坑

背景:4 盘位很多新机器自带 2 个 nvme SSD 缓存,觉得这玩意儿能显著改善群晖万年牙膏 CPU 带来的短板,然而,不幸的是,这个 nvme SSD缓存机制有坑。

  • 从数据安全的角度,不建议做读写缓存:群晖nvme SSD 缓存有 2 种,一种读缓存,只需要 1 个 SSD 就可以,另外一种是读写缓存,需要 2 个容量一样的 SSD,而且只能为一个存储空间加速(不像隔壁家有分层存储技术)。鉴于 99%的人不会在 RAID 中设定多个存储空间,所以这个问题倒也影响不大。但读缓存是可以随时拆,随时换,不影响到数据安全。而读写缓存是和存储空间并在一起的(据说 7.0 的会做调整),也就是说如果ssd突然暴毙,或者脑抽关机拆了一个 SSD,与读写缓存相连的这个存储空间会挂掉(数据可修复,但需要linux知识),很多人会用一个一些垃圾主控真香盘作为缓存(谁不是呢。。反正放着也是放着),读写缓存就会导致数据安全的问题。

  • 从性能的角度,不建议做读写缓存:另一方面,读写缓存究竟对918+这种 J3455 的主机有多大帮助呢?我分析了读写缓存的机制,测试,以及 reddit 网友的各方面评论,结论是读写缓存主要是在群晖用于网页服务,iscsi,虚拟机的情况下有较好的加速作用,但是以目前群晖的牙膏机能,配置 nvme 的家用机型,这三样跑起来都很慢,因此读写缓存聊大于无。大部分家用场景,做读缓存就够了,读写缓存没有任何帮助,反而增加了存储空间挂掉的风险。

  • 缓存要保留一定的未分配空间,防止写入放大:关于群晖的 nvme缓存,本人血泪教训已经挂了5块不同牌子的SSD,都表现为写入量很少,但是 health 0%的情况,无法再用于群晖缓存,这些 SSD可以拔下来插到普通电脑上去继续用,但是每次启动都要按 F1。经过和网友的相关交叉比对,应该是因为群晖的坑导致的写入放大所导致。也就是群晖的缓存自动释放速度很慢,当缓存占用率 99%后,会反复对一些块进行移除,写入,导致 health 下降。解决的办法是在配置 ssd 缓存的时候,不要把所有的空间完全都分配给缓存,建议只分配 80%,这样能有效的避免这个问题。


多盘位机器
如何把牙膏的性能发挥到极致


背景:如果有条件购买到 1618+,1819+之类的多盘位机型,盘位是够了,但是很快就发现群晖的 3 大牙膏 1)CPU 老旧;2)千兆网卡;3)阵列IO 性能一般,怎么解决呢?

  • 不要犹豫,内存加满:群晖的内存 swap 既充当了读缓存,所以不要犹豫,加到机型支持的最大内存。一般是 16X2= 32GB

  • PCI-e 优先万兆,不要搞 SSD 缓存:如果你的机型不支持新出的E10M20-T1 SSD&万兆二合一卡,那 pci-e 优先加万兆网卡,为什么?往上看四盘位的坑。

  • 如果盘位富裕,1号盘位建议用 sata SSD 代替:群晖的机制是默认从1号盘位开始读系统,然后 app 的缓存都是默认放在存储空间 1 内的。通常情况下,HDD 做的 RAID 随机读写性能很一般。建议如果盘位够的用户(比如 1618+,1819+)之类的,可以考虑放个 SSD 到 1 号盘位,设定为basic存储空间,用于套件及及各类缓存。2-8 号盘位做 HDD RAID,这样的话,在日常使用,能显著提升系统的响应效能,比 nvme 缓存效率要高很多。

(0)

相关推荐