奋起之时,Ceph之父Sage Weil来华:产品化是唯一出路

【数据猿导读】愿景虽好,但中国与全球市场相比,Ceph从社区到商业化依然道阻且长。“从全球市场来看,Ceph更多的是面向新型的应用,像OpenStack和云这些新的应用场景,虽然Ceph在中国的发展也十分迅速,但是国内大部分客户有很大传统的架构保有量,这样一来就会影响创新的速度,这需要业内人士共同去探索。” Sage Weil表示。

作者 | 郭敏

官网 | www.datayuan.cn

微信公众号ID | datayuancn

随着OpenStack在国内外快速落地,作为开源存储方案之一的Ceph也大行其道。根据国内首个《分布式存储Ceph技术及应用白皮书》显示,在过去的三年中,依托于Ceph落地的应用越来越多,覆盖了包括金融、政府、游戏、运营商、媒体等在内的众多重点行业。

Ceph在中国的发展远比Ceph之父Sage Weil的预想要快得多。Ceph是什么样的存储方案?Sage Weil又是何许人也?

在切入正题之前,我们先来八卦下这位IT男神丰富的人生经历。1997年,刚上大学不久的Sage Weil创立了DreamHost;2000年,Sage获得了Harvey Mudd College计算机科学学士学位;在加州大学Santa Cruz分校攻读博士期间,Sage Weil以Ceph为课题进行了具体的研究。在校期间,Sage与Scott Brandt教授一起完成了一致性协议、数据分发(CRUSH)和元数据管理器Ceph分布式文件系统,广受好评。

“年轻有为”、“IT大神”是朋友对他的评价,Sage Weil对于技术十分专注,他曾说他是Ceph的忠实信徒。

在2006年的OSDI学术会议上,Sage正式发表了介绍Ceph的论文,并在该篇论文的末尾提供了Ceph项目的下载链接。由此,Ceph开始广为人知。

据Sage Weil透露,项目发展初期,Ceph针对的目标应用场景是大规模、分布式的存储系统。所谓“大规模”和“分布式”,是指至少能够承载PB级别的数据,并且由成千上万的存储节点组成。

2011年,Sage Weil创立了Inktank公司主导Ceph的开发和社区维护。随着Ceph在存储领域的影响力越来越大,吸引了一批国内有志青年投身其中。

2014年,在耿航、孙琦等一批志愿者的努力下,Ceph中国社区成立,该社区以文档、翻译、案例等形式全方位地展现Ceph发展和应用状况。

那么,如今Ceph的发展和应用情况如何?Ceph从社区到商业化,中国与全球相比是不是还有很大的差距?如何更快的与之接轨?Ceph未来会朝着什么方向发展?

带着这些问题,数据猿记者在日前的Ceph亚太峰会 —— Cephalocon APAC 2018会议现场采访了Ceph社区创始人、红帽首席咨询师 Sage Weil,CERN存储系统工程师、Ceph顾问委员会成员Dan Van Der Ster,英特尔中国云计算战略总监陈绪,红帽首席方案架构师张家驹以及海航云易建科技服务事业群技术总监刘世民。

在过去十几年的时间里,经过不断迭代和完善的Ceph已经成长为一种性能优秀、高可靠性和可扩展性的分布式文件系统。此时,CephFS文件系统已经不再是开发重点,与虚拟化相关的RBD、RGW取而代之成为新的发展方向。

据Sage Weil透露,Ceph有以下三个特点:

1、CRUSH算法

CRUSH算法是Ceph引以为豪的两大创新之一,能为同一个数据对象找到最合适的停靠点,从而实现各类负载的副本放置规则,例如跨机房、机架感知等。同时,CRUSH算法支持副本和EC两种数据冗余方式,还提供了四种不同类型的Bucket,充分考虑了实际生产过程中硬件的迭代式部署方式。

2、统一存储架构

Ceph设计的RADOS架构是为了实现一个高性能的文件系统服务,不需要考虑横向扩展、冗余、容灾、负载平衡等复杂的分布式系统问题,同时能够提供足够多的特性和足够优秀的性能,因此迅速得到了社区的认可。

由于 RADOS 出色的设计和独立简洁的访问接口,再加上Sage敏锐的眼光,Ceph果断推出了用于支持云计算的块设备接口RBD、对象存储接口RADOS GateWay和Ceph File System(POSIX接口),并将开发中心全面转向云计算领域。

3、丰富的特性

Ceph的特性不可谓不多,从分布式系统中最基本的横向扩展、动态伸缩、冗余容灾、负载平衡等,到生产环境中非常实用的滚动升级、多存储池、延迟删除等,再到高大上的CephFS集群、快照、纠删码、跨存储池缓存等,强大的功能让人叹为观止。

从以上三个特性中不难看出,Ceph越来越向云计算的方向靠拢,对此,Sage Weil感慨良多:“在OpenStack出现以后,我发现Ceph的目标已经成了为云计算提供基础设施的概念,之后Ceph逐渐向块存储和对象存储偏移,并为OpenStack提供了良好的支持。”

作为Ceph的忠实信徒,最近几年,Sage Weil一直将Ceph和其他不同的组件进行融合,“Ceph从社区到商业化是大势所趋,毕竟所有技术的最终归宿都是产品。” Sage Wei坦言。

对此,张家驹表示:“我们把Ceph社区做得越来越成熟,生态越来越繁荣。同时,社区和产品还是有区别的,社区比较发散,追求创新,产品却比较收敛,会收敛到不同的领域和不同的行业,做出稳定的企业级产品。”

在过去的几年里,RedHat、SUSE、Canonical、FreeBSD等构成了Ceph 软件发行包的厂商,Intel,Mellanox,AMD 和 Cisco 分别在不同的硬件组件层面推动自身融入Ceph 体系,SanDisk,HDS 和 Fujitsu 都在自身的存储系统上采用 Ceph 进行整合……

目前,Ceph的应用场景有云平台、传统企业IT架构虚拟化等。在采访期间刘世民以海航为例做了说明:以Ceph支撑的海航IT系统可快速实现扩容,“我们的存储有两种形式:一种是Ceph的分布式集群,叫‘海洋存储’;另一种是将Ceph技术用于一体机,Ceph有非常强的灵活性,大的可以用,小的也可以用。”

不过,Ceph在延迟方面还是存在一些欠缺,“很多企业用户喜欢拿Ceph和SAN相比,SAN有很多特性,比如去重、压缩、同步、异步等,在这些方面Ceph还是有点欠缺。” 刘世民说。

除了刘世民之外,Dan Van Der Ster也透露了CERN使用Ceph的原因:“最开始选择Ceph是因为经费的问题,在OpenStack上Ceph是最好的存储选项,后来我们把Ceph用于云平台,之后我们发现Ceph还可以用于高性能计算和粒子对撞计算,用CephFS文件系统提供高性能计算存储数据,五年内没有丢过一个数据。”

或许正是由于这样的特性,在过去的几年里,Ceph的火焰烧的漫山遍野,在Ceph中国用户生态圈里可以看到移动、电信、中兴、恒丰银行、平安科技、阿里、腾讯、网易、乐视、携程、今日头条等巨头们的身影。

国内越来越多的行业用户在使用Ceph,证明其稳定性和可靠性的同时也促进了Ceph的进步,现在,已经有很多机构加入了Ceph中国社区,其中不乏Intel、Dreamhost、SanDisk这样的大厂,类似于UnitedStack这样的公司也赫然在列,还有电信、大学、研究所这类非存储领域的公司或单位。

陈绪告诉数据猿:“2014年以来,在国内,我们看到了很多基于Ceph创业的公司和大IP公司,他们在使用Ceph的过程中积极地向社区反应问题,帮助社区解决问题,把社区生态和商业落地做大是我们共同的心愿。”

愿景虽好,但中国与全球市场相比,Ceph从社区到商业化依然道阻且长。“从全球市场来看,Ceph更多的是面向新型的应用,像OpenStack和云这些新的应用场景,虽然Ceph在中国的发展也十分迅速,但是国内大部分客户有很大传统的架构保有量,这样一来就会影响创新的速度,这需要业内人士共同去探索。” Sage Weil表示。(文/郭敏)

4月26日-4月27日,AI in China 之智能制造-数据驱动产业变革-高峰论坛即将开始,期待我们的见面👇

(0)

相关推荐