争议 | 集中式高端存储会被分布式存储逐步取代吗?
来自twt社区同行交流,欢迎更多同行参与交流
集中式高端存储未来的市场如何?是否会被分布式存储逐步替代?
问题来自社区会员@chenmingfu 某银行 基础架构组长,下文来自twt社区众多同行实践经验分享,欢迎大家参与交流,各抒己见。
@张鹏 某城市商业银行 系统运维工程师:
集中与分布式存储应不同的业务类型而生,集中式存储以稳态业务为主,多要求传统架构的表现出足够的稳定性和突出的能力,对于大IO的高吞吐量,和小IO的低延时和数据的强一致性都有较高的标准和明确要求,适合在银行核心系统架构中作为一级核心存储;而分布式存储多服务于分布式文件和对象,具有较高的可扩展性,而且硬件成本低廉,多用于HCI平台, 适用于面向互联网、横向扩展的分布式业务,符合敏态业务发展规律,二者短期内还无法做到完全的替代。
但集中式高端存储与分布式存储之间,也在互相学习各自的技术长项,如集中式高端存储也逐渐能够进行Scale-Out的扩容,并通过SSD技术的深入进一步降低成本;分布式存储也在通过诸如NVMe/RDMA进行硬件升级、优化IO路径、优化模块处理时间、磁盘分布和增加数据缓存层等几个方面提高性能,像集中式存储一样变得适应多个业务场景,但相信未来不论怎样发展,二者可能在市场中存在的比例会有所不同,但都会在支持好各自业务发展上求同存异。
@舞林人 泸州银行 系统工程师管:
虽然各大咨询分析机构都预测未来是分布式存储的天下,但是分行业来看,至少在金融这种强监管行业里,核心账务等关键业务场景下集中式高端存储仍然是绝大多数金融机构的选择,集中式高端存储的稳定可靠的特性决定了它的市场价值,尽管近年来分布式存储技术飞速发展,市场占有率也在逐年上升,但是从产品细分领域看,分布式存储目前主要是在传统中端存储的应用领域发力,这个市场普遍的特点是数据量大但是对数据的稳定可靠要求不是特别高,而在核心关键场景,高端存储仍然是绝大多数用户的选择。
@Jerry 系统架构师 某金融公司:
集中式高端存储和分布式存储倒不会存在明显的一方替代另一方的局面,至少在短期内不会出现,更倾向于作为两种存储架构共同支撑业务。
在设计初衷及定位上,两者存在明显差异:集中式高端存储的设计初衷便是支撑核心业务的运行,高并发低延时,满足高性能、高稳定性、高可靠性的严格标准,一般都能达到15个9的稳定运行时间要求;分布式存储,强调的是横向扩展和并发性能,重心并非聚焦于核心业务的支撑。其次,发展周期不同:集中式高端存储已经经历了相当长的时间,其升级迭代以及存储生态都已经趋于完备;而分布式存储,兴起不久仍需技术的打磨,整体解决方案的发展仍需要成长。最后是对数据保护,集中式高端存储无论是存储自身的数据校验、故障自愈等防御机制已经十分完善,对于数据保护手段也兼容第三方备份恢复软件实现对LUN以至于数据块的全方位保护,整体解决方案健全;而分布式存储对于存储的数据一致性校验的强可靠性与稳定性仍然需更高效的实现,数据保护方面也更依赖副本,手段相对单一。
@chenmingfu 宁夏银行股份有限公司 基础架构组长:
从切换操作的可视化方面来看,web操作较为具备优势,非专业人士也能通过简单的web页面点击菜单或按钮就能快速简单实现切换操作,但是从切换效率方面来看,可能还是CLI更有优势,CLI不过多依赖浏览器等工具,不会出现浏览器工具兼容性问题,能够专业实现切换操作。但是CLI需要非常专业的人员才能操作,部分厂商的命令较为复杂,普通人员很难进行操作。
@孙伟光 中国金融电子化公司 IT顾问:
集中高端存储具有很多年的技术和市场底蕴,在其传统行业具有举足轻重地位,其产品特点就是以安全稳定自居,随着互联网,分布式架构兴起,也在不断地与时俱进,配置闪存提升了极致的性能,也开放拥抱X86架构开源平台,比如容器平台存储接口,虽然内部封闭,但也不失开放。
分布式存储这几年随着互联网和分布式兴起,也占有了一席之地,产品特性就是极致的扩展性,提高了稳定性,安全性通过多副本去解决,也就是扩展性好的同时也要保证其数据的安全性。
对比两者应该说是各自有各自的战场,不是彼此取代,而且谁更合适自己的应用场景,最终还是为上层的应用服务。
@alphaaries 华为数据存储解决方案中心 技术总监:
集中式和分布式存储是存储的不同形态,两者都是为了实现性能和功能的存储设备,两者的演进趋势也是趋同,未来可能是两者相互融合的态势。
@潘延晟 系统工程师:
两种架构从目前的技术发展来看,还是不产生明显的业务冲突的。各有各的优点,也各有各的应用领域,当一个业务系统庞大到一定程度后,一定会有多种技术手段融合进来。形成符合这个行业,这个企业的独特架构,不同的架构方案只能是作为参考。更多的时候或者将来应该只有适合企业的技术架构。技术发展上可能会越来越灵活多变。
两种架构都在自己的方向上去不断解决和突破该项技术中存在的问题。虽然原理不同,但实现的目的确实相同的,更快,更大,更稳定,更便宜。这其实也是市场的最终需求。谁能够满足用户越来越多便的需求,谁就能在市场占有一席之地,目前的IT行业已经更加开放,更加包容,更多的技术未来可能会相互借鉴,融合。而随着IT架构越来越多样化,IT技术更新迭代越来越快,作为信息系统最为核心的数据存储也会跟着不断的演变,最终淘汰存储架构的甚至有可能是其他层面的技术方式。
@sharkbing EDI 研发工程师:
两种架构从目前的技术发展来看,还是不产生明显的业务冲突的。各有各的优点,也各有各的应用领域,当一个业务系统庞大到一定程度后,一定会有多种技术手段融合进来。形成符合这个行业,这个企业的独特架构,不同的架构方案只能是作为参考。更多的时候或者将来应该只有适合企业的技术架构。技术发展上可能会越来越灵活多变。
@沈天真 浪潮商用机器企业云创新中心 售前支持:
个人观点,没有一种技术可以解决所有问题。集中式存储起步早,技术成熟,架构简单,运维简单,但是无法很好支撑高并发访问性能。分布式存储起步晚,技术还在发展,架构复杂,运维要求高,但是可以支撑高并发访问。归根到底还是看应用场景,离开应用场景谈技术,谈架构,都是扯淡的。传统企业核心业务场景要求的首先是稳定,可靠,成熟的技术,对高并发要求不高,感觉还是集中式高端存储靠谱。新兴的互联网业务,大数据场景对于高并发要求很高,要处理的数据量很大,分布式存储也是在这种要求下产生的。另外,核心与非核心也都是相对的,某个业务在这个企业是非核心业务,换到另外一个企业就是核心。不过,从发展趋势看,感觉分布式存储会越来越多,集中式存储增长空间有限,毕竟我们已经进入大数据(量)时代。
@anonym 系统工程师:
集中式和分布式是存储的不同部署形态,因此两者从本质上都是用以提供容量和性能的磁盘空间。目前两者集中式善于单点、集群的性能,分布式更加适用于海量横向扩展的应用。
@wzpystcdc 某公司 研发工程师:
还是得看用户的业务场景吧,不是高并发低延时要求的分布式存储完全够用了。