2021,国产数据库的躬行实践之年

墨墨导读:庞大的用户和数据基础,将最有可能在实践领域,推动国产数据库出现创新性的实践突破。

在2020年底举行的数据技术嘉年华大会上,我曾经提到,这是国产数据库最好的时代,而中国的数据库技术也应该登上历史的舞台,回馈国际数据库领域和社区

那么国产数据库如何才能站上历史的舞台呢?
我想答案只有四个字:躬行实践

提示:查看以下提到的论文,请将地址“https://www.modb.pro/db/44108”复制到浏览器中打开或者点击“阅读原文”即可。

躬身入局 拒绝迷茫

我在大会演讲的 PPT(下载地址:https://www.modb.pro/doc/6815)中,引用了『躬身入局』四个字作为给自己和DBA们的警示,在变革的浪潮中,没有人能够作壁上观,与其原地彷徨,不如躬身入局,先入为主,在实践中抓住变革中的机遇。

而当技术人员、从业者能够看清楚行业的变化,企业的选择自然也就清晰明了、水到渠成,所以唯有实践,才是破题之法。

实践是国产数据库的进步之源

毫无疑问,关系型数据库仍然是当今行业应用的主流,在 DB-Engines 的排行榜上,RDBMS的积分占比高达 73.9%,牢牢掌握着企业的核心数据。

IBM的研究员 Edgar Frank Codd 博士,在 1970年发表了论文《A Relational Model of Data for Large Shared Data Banks》,由此开创了关系型数据库的历史潮流,并且成就了一个行业:

在那之后,Google 关于分布式的几篇论文则是对于分布式数据库技术发展,产生了深远的影响,以下几篇论文值得每一位数据库领域的从业者仔细阅读:

  1. The Google File System

  2. Bigtable: A Distributed Storage System for Structured Data

  3. Spanner: Google’s Globally-Distributed Database

  4. F1: A Distributed SQL Database That Scales

从 IBM 到 Google,这其中改变的是什么?我想就是实践、史无前例的高速实践。
Google 从互联网的极速增长中,不断去探索和解决数据库领域的难题,从而不断做出『实践出真知』的理论上的升华,进而引领和改变着数据库领域。

毫无疑问,在理论范畴,中国数据库领域仍然处于学习阶段,重量级原生的基础理论还很难在中国诞生。但是,中国拥有的庞大用户和数据基础,可以高度集中的社会行业应用,将最有可能在实践领域,推动国产数据库出现创新性的实践突破。

在过去,中国高速发展、快速迭代的互联网创新、电子商务时代、互联网金融,以海量用户、高并发场景,对数据库提出了挑战,这也使得分布式数据库技术,在交易场景中,率先得到了大量的尝试,并走向了成熟应用。这也是今天,分布式数据库在中国发展迅猛的根本原因。

在墨天轮国产数据库流行度排行榜(https://www.modb.pro/dbRank)上,前十名中,大部分都是分布式数据库。

  • 榜首位置的 TiDB 是原生的分布式数据库;
  • 达梦数据库 也在2020年底发布了分布式数据库产品,同时具备了RAC集群和分布式架构体系;
  • 第三名 OceanBase 是自蚂蚁金服锤炼而出的原生分布式数据库;
  • Gbase除了原有的 8a 分析型 MPP 产品,也在分布式方向扩展产品;
  • TDSQL 是腾讯统一数据库品牌之后的统一标识,TDSQL 是支持分库分表模式的分布式数据库;
  • PolarDB 是阿里云的云原生数据库,其 PolarDB X 产品是分布式架构;
  • GaussDB 既有分布式 OLTP 数据库形态,也有并行 MPP 形态,分布式是其主打的方向;
  • GoldenDB 是基于 MySQL 的分库分表模式的分布式数据库;

分布式数据库无疑是中国数据库市场基于实践的创新探索,并且正在加速进入各类企业应用场景。

有了创新产品还不够,数据库产品如何能够快速成长和成熟?无疑还是四个字:躬行实践

只有经过更多场景的实践考验,解决实践中遇到的种种问题,一个数据库产品才能够快速成长起来,所以当互联网上或者墨天轮社区里,哪一个国产数据库的问题多起来、讨论多起来,我认为才是国产数据库应用实践大发展的明证

所以,我想在2021年,对于所有国产数据库的关键是,如何快速的找到更多的实践场景,在实践中检验产品,不断提高基础软件中的工程化能力,全面提升国产数据库的品质。

而对于企业用户来说,也应该在不同场景中,给予国产数据库实践和落地的机会,如此产用相互促进,才能加速生产实践中的应用变革,从星星之火,到燎原之势。

国产数据库的学术成就

根据中信证券的分析报告,在数据库技术的前沿研究领域中,中国已成为影响力最强的国家之一。

  • 通过分析 VLDB 近6年来的论文发表,中国数据库领域的研究进展不断加速;
  • 2020年 VLDB 刊登的 63 篇论文中,其中来自中国学者和研究人员的文章有23篇,在所有国家中排行第一,占比 36.5%;
  • 从业界来看,阿里巴巴和腾讯的成果显著,其中阿里巴巴发表了3篇论文,与Google、微软、IBM相同
  • PingCAP 在2020年也在 VLDB 发表了论文《TiDB A Raft-based HTAP Database》;

以下图表是 6 年来, VLDB 接受的论文数量,中国的高质量论文数量不断上升,国内厂商中,分别是阿里、腾讯、PingCAP位列前茅:

从2020年论文发表数量来看,中国已经成为数据库技术前沿研究领域影响力最强的国家之一,当来自实践的成果不断转化为技术源动力之后,我坚定的相信,中国数据库必将获得爆发式的增长:

开源数据库改变世界

在2021年的第一个月份里,DB-Engines 的流行度趋势上,开源数据库第一次超过了商业数据库,现在开源数据库的流行度以50.6分领先于商业数据库。

开源通过漫长的历史时期,成功的改变了软件世界,开源不仅仅是代码,更是一种信仰,一种人类对自由的向往。

在墨天轮排行榜上,前十位中,有两个重要的开源数据库:TiDB 和 openGauss。

  • TiDB 在分布式和开源的信仰下,构建了活跃的数据库开发者社区,也从而登上了榜首之位,是当之无愧的冠军得主;
  • openGauss 是华为的企业级数据库 GaussDB 的开源呈现,自2020年6月30日开源,仅仅半年时间,就冲入了排行榜前10位,成长非常引人关注,也因此获得了墨天轮排行榜『年度数据库』称号;

从商用到开源,数据库的发展路径从来就是多姿多彩的,而在中国的数据库时代,开源数据库的商业化也正在开出绚烂的花朵。

总结

2020 年,全球 DBMS 市场受疫情冲击小幅降至 487 亿美元,但云数据库保持了 11.6%增速。IDC 预测 2024 年全球数据库市场规模稳步增长至 739 亿美元。受益于云数据库和国产替代双重驱动,中国数据库市场增长提速。2020 年,中国数据库市场规模达 200 亿元,同比增长 22%。

在过去两年,我曾写下的两篇文章,可供回顾:

  1. 2019,国产数据库元年开启新纪元
  2. 2020,国产数据库崭露峥嵘的发轫之年

那么,2021 期望所有的国产数据库,在时代浪潮之下,在躬行实践中,找到创新引领的行业之路!

墨天轮原文链接:https://www.modb.pro/db/44108(复制到浏览器中打开或者点击“阅读原文”立即查看)

(0)

相关推荐