存储三部曲:谁将站在NAS鄙视链的顶端?

目前数据存储的形态,主要就是SAN、NAS和OBJ这三种。作为存储三部曲的第一部,先来说说我最喜欢的NAS。

NAS(Network Attached Storage),网络附加存储。简单的说,NAS就是一个专业的网络文件系统。

NAS的主要场景与分类:

主要用于应用系统存储非结构化数据(文档、图片、语音、视频等),不仅是为了存储,更是为了共享。在应用负载均衡架构下,更能体现出一种简约。

关于数据中心级的NAS产品,主要分为商用和开源两个技术阵营。

商用:主要是NetApp的FAS、EMC的Isilon,还有新的Qumulo

开源:主要是Ceph和Gluster两个社区项目

NAS的使用经验与教训:

产品,就像人一样有故事。我有个朋友,就跟我讲过一个他和NetApp“小故事”。

早些年,朋友还是个无知少年的时候,在展会上看到NetApp,不知道是干啥的,回来就开始学习了解,感觉技术很不错,再后来还就真有机会引入了NetApp的NAS解决方案,用于支撑办公类文件存储。

只是没想到在最后存储割接过程中发生了严重的性能瓶颈。费了半天劲定位到问题,是因为一个文件目录里存了254万多个“垃圾”文件,算是文件存储规划踩了产品技术限制的雷。

因为NAS是基于文件系统的,所以受制于文件系统特性,使用NAS支撑非结构化数据存储时,特别是对于海量小文件的情况,一定要提前做好相应的存储目录层次设计,最好有4-5层的目录深度,日期就是很重要的维度,最终目的就是为了控制单一目录中的文件数目,降低系统开销。

要深刻认识到码农的技术局限性,尤其是对于IT基础架构,可以说几乎没有经验,必须建立开发对于数据存储目录的设计规范,反复宣导,定期排查,否则,搞不好哪天就会在NAS上长出一个瘤,运气不好还会癌变。

分布式NAS的现状与对比:

再说说开源,随着互联网的飞速发展,传统的NAS在并发,扩展和容量上无法支撑互联网业务模式。所以,后来BAT们都通过自研的方式解决了他们于非结构化数据的存储支持,而这一切的改变都要归功于亚马逊的S3,这一点留到下一次再细说。

其实早期的商业产品也有过Scale-Out NAS的尝试,但缺少分布式和互联网的基因。但随着开源技术的发展,分布式的NAS的出现也是必然。

关于分布式NAS,恰巧我有个客户正在做相关测试,顺便问了问情况。

  • 关于Ceph的CephFS,各方认为都不成熟,无法用于生产,客户不考虑测试。

  • 客户对Gluster比较感兴趣,测试后感觉还不错,但目前不支持数据分层。

  • Ceph和Gluster的背后都有Redhat和IBM的身影,再算上GPFS,产品有重叠。

  • 考虑到支持国货,客户还测了一款叫OpenFS的软件,并与Gluster做了对比。

OpenFS,是国产存储公司宏杉科技基于Gluster做的SDS(Software Define Storage,软件定义存储)产品,并针对元数据(metadata)和存储块(brick)的存储做了优化和改进,因此相比传统的Gluster,OpenFS的读写性能提升了不少。

对于国产,还是有要给于足够的宽容和耐心,如果你有一点点心动,有一点点风控,可以尝试一下国产分布式NAS。

要说客户的常规需求,传统的NAS设备都能解决,而且还有丰富的功能和完善的容灾解决方案。但是如果不是分布式的,估计大概率会被鄙视。为了能站在鄙视链的顶端,我这个客户特意对分布式NAS做了些学习研究,仅供参考。

当下,正处于一个基于X86的分布式时代。科技进步会演进掉一些产品,但市场才是检验产品的试金石。目前看,企业内部的IT基础架构中还是离不开NAS,至于商业和开源,那就是仁者见仁,智者见智的事情了。而所谓的鄙视链,只不过是个怪圈,这一点,友商们最清楚不过了!

(0)

相关推荐