云数据库爆发,国产基础软件会迎来发展新机会吗?

云数据库已经势不可挡。
出品丨自主可控新鲜事
本文内容来源于infoQ
正文共3291,建议阅读时间10分钟

近日,Gartner 最新一份关于 2011-2021 数据库管理系统(DBMS)全球市场格局的报告引起了行业关注。该报告显示了数据库行业的两个重要转折点:一是微软市场份额首次超越甲骨文成为全球第一,其次便是云数据库的爆发。
在报告中,排名前十的企业中有 4 家云计算公司,同时,这些云计算公司与甲骨文、IBM 等传统数据库厂商之间的差距正在不断缩小。两年前,Gartner 就预测了云将主导数据库市场的未来,这一预测似乎在两年后得到了印证。

云数据库“翻盘”

微软能够超越常年霸榜的甲骨文,背后的依仗是云计算。2014 年,当时刚上任的微软 CEO Satya Nadella 提出了“云计算为先、移动为先”的转型口号。当年,微软云计算业务实现收入 44 亿美元。七年过去了,仅 2021 财年第三财季度,微软智能云部门的营收已经达到 151.18 亿美元。微软仍在享受着云计算带来的红利。
在云计算的带动下,数据库产业也正在发生变化。
传统商业数据库授权与硬件投入要数十万元起步,扩容需要数月规划、数周实施,整个迭代过程要以“年”为单位计算。昂贵、扩展性差、复杂等是传统数据库自身就有的问题。云厂商将传统数据库搬到云上,以租赁方式为用户提供服务,同时自研主打计算与存储分离的云原生数据库(Cloud Native),也以租赁方式提供服务。
凭借部署简单、成本较低,并且高可靠等特性,云数据库吸引了很多传统数据库用户。另外,云厂商也凭借人工智能技术优势提供了更多数据智能方面的服务。数据显示,在过去十年,企业上云的意愿从 3% 上升到了 84%。
过去两年中,整个 DBMS 市场的增长率分别为 13%和 18.4%。根据 Gartner 的调查,大多数数据库收入增长都发生在云上,本地增长正逐步萎缩。
说到 DBMS,不得不提数据库商业的起源:关系型数据库。关系型数据库在数据库商业化历程中扮演了重要的角色。根据 DB-Engines 发布的 5 月份数据库排名,前十中有 7 个是关系型数据库。虽然历史最久,但关系型数据库仍是目前最受欢迎的类型,也是云数据库首先进入的领域。
20 世纪 60 年代,查尔斯·巴赫曼(Charles Bachman)设计了第一个计算机化数据库。不过,现在被广泛讨论的关系型数据库的起源是在 1970 年。1970 年 6 月,IBM 计算机科学家 Edgar F. Codd 在发表的 :
“A Relational Model of Data for Large SharedBanks”
(https://www.seas.upenn.edu/~zives/03f/cis550/codd.pdf)
论文中首次提出了“关系模型”的概念,这为之后主流数据库研究奠定了理论基础。但在该论文发表 6 年后,市场上才出现相关的数据库产品。
1976 年,美国霍尼韦尔公司(Honeywell)开发了 Multics Relational Dat a Store,开启了商用关系数据库的时代。当时,甲骨文创始人拉里·埃里森(Larry Ellison)还在一家为中央情报局服务的软件公司上班,但他已经敏锐地嗅到了商机,次年便与同事 Bob Miner 创办了一家计算机公司,也是 Oracle 的前身。
1979 年,Oracle 将第一个商业数据库推向市场。而关系型数据库的提出者 IBM 到了 1983 年才将 DB2 带入商业市场,软件巨头微软则在 1989 年推出了另一个明星产品 SQL Server。
随着数据库逐渐变成企业的重要基础设施,以 Oracle、微软为代表的关系型数据库几乎垄断了整个市场。寡头垄断带来的副作用也随之而来,居高不下的价格、不尽人意的服务,企业们虽苦“巨头”久矣,但并没有其他更好的选择。
2000 年,开源文化蔓延到数据库领域,陆续诞生了 MySQL、PostgreSQL 等开源数据库,并吸引了大量拥护者。这在一定程度上缓解了企业的成本焦虑,也终结了 Oracle、SQL Server 在关系型数据库上的神话。
而云计算时代的到来彻底扭转了数据库行业的格局。2008 年,云计算的时代大幕逐步拉开,在 AWS 证明云是可行业务后,越来越多的行业巨头入局,云厂商开始成为数据库领域的主要玩家。
数据显示,2019-2024 年,传统数据库的年增长率保持在 4% 左右,而云数据库市场的年增长率高达 16%。云数据库已经势不可挡。

国产数据库,借力崛起

云计算在改写数据库格局的同时,也帮助国产数据库实现了弯道超车。其中一个重要标志就是在去年 11 月,在 Gartner 公布 2020 年度全球数据库魔力象限评估结果中,阿里云成为首家入选领导者(LEADERS)象限的中国科技公司。在数据库领域,中国企业第一次追上西方科技公司,站在了行业的第一梯队。
回顾过往,中国在数据库上落后了近二十年。在西方已经在推广商业数据库的时候,“数据库”一词在国内还鲜有人听闻。
1978 年,中国人民大学创办了经济信息管理系,第一任系主任萨师煊与其他学者首次将“数据库”概念引入国内。可能很多人都没有想到,一个技术词汇的首次出现是在经济管理应用学科中。萨师煊与弟子王珊在 83 年合作编写出版的《数据库系统概论》一书,是国内第一部系统阐明数据库原理、技术和理论的教材,一直被大多数院校计算机专业和信息专业使用。
技术薄弱、人才缺乏,国内数据库市场一片空白,随后便被已经成熟的外企迅速拿下。
1989 年,Oracle 决定进军中国,并将 Oracle 的中文名注册为“甲骨文”,之后通过拿下东三省邮电管理局 5 期工程的大单在中国数据库领域迅速站稳脚跟;1991 年,Sybase 进入中国大陆;1992 年,IBM 在正式进军中国,带来了 DB2 和 Informix 等产品,同年,Microsoft 在北京设立代表处。到了 1999 年,中国数据库行业格局已经形成了 IBM、DB2 和 Informix 占领金融行业,Oracle 一统电信行业的格局。
反观目前国内数据库领域的头部企业,亚信科技在 95 年诞生、阿里巴巴和腾讯在 99 年诞生,而像 PingCAP、MarkLogic、巨杉数据库、达梦数据库等垂直企业也都是在 2000 年后才创建发展。中间巨大的时间差,给了外企在国内充分的发展空间。
但在业务规模不断扩大、数据量爆发式增长的情况下,“Oracle 数据库 +IBM 小型机 +EMC 存储设备”的高额开支开始让不少企业难以忍受。国外科技企业开始“去 IOE”,在 13 年“棱镜门”事件的刺激下,国内也掀起了“去 IOE”的热潮,达梦、金仓、神通、南大等一批国产数据库得到广泛关注。而国内最早提出“去 IOE”的互联网企业阿里巴巴也身先士卒,最终实现了数据库领域的大“跃迁”。
2010 年,阿里基于 MySQL 着手打造开源数据库 AliSQL,并对淘宝商品库进行改造。三年后,淘宝核心系统中的最后一台 Oracle 数据库下线,这也成为“去 IOE”历程中的一个重要节点。
2017 年 9 月,阿里云发布了自主研发的云原生数据库 PolarDB,并在次年四月正式商用。此后,阿里云在自研数据库的开发上不断加速,目前可以提供包括关系型数据库、分析型数据库、NoSQL 数据库及相关的服务与工具等。
在丰富度提升的同时,这些产品也经受住了高流量、高并发业务的考验。在去年的双十一中,阿里数据库 OceanBase 和 PolarDB 每秒处理峰值都远超 Oracle,支撑了高达 58.3 万笔 / 秒的订单创建峰值,零点突增 145 倍(与日常相比)的业务负载,成功抵御了几乎是全球最猛的流量洪峰。
Gartner 报告显示,阿里云已经位居全球云数据库市场份额第三位以及中国市场第一位,年增长率达到 116%,而阿里云 94% 以上的头部用户都购买了云数据库产品。以阿里云为代表的国产数据库终于由跟随者逐渐发展成为竞争者,在经过四十多年的追赶后,终于扮演起行业“引领者”角色。

云数据库还有哪些挑战?

亚马逊云计算业务亚马逊网络服务首席执行官 Andy Jassy 在去年的演讲中表示,尽管云计算在十多年内席卷整个 IT 市场,但从数据来看,云计算只占到全球 IT 市场份额的 4%。云计算市场尚且如此,作为其中的云数据库市场更有很多潜力。
Gartner 曾预测,到 2023 年,75% 的数据库都会跑在云平台之上。虽然经过多年发展,云数据库产品已经相当成熟,但实际也还有很多问题需要解决。
根据 IT168 发布的《云数据库选型及满意度调查报告》,功能受限是中国企业使用云数据库服务中最突出的问题,而从系统维度看,稳定性是最突出的问题,如网络质量问题。其次,共享存储和宿主机性能瓶颈问题也十分突出,比如共享存储问题。最后,云上目前还很难达到线下大厂的使用体验,如果企业希望通过上云来解放 DBA 的工作量,目前看还不现实。
而这些问题归根到底还是技术问题。阿里巴巴集团副总裁、达摩院数据库首席科学家李飞飞曾指出,云原生数据库最大的价值是将原来割裂的应用资源变成一个很大的池子,然后更好地发挥池化资源优势来做到弹性高可用,但要真正做到弹性高可用却有很多技术难点需要解决。比如存储计算分离以后,读写数据如何保证一致性?用分布式共享存储 RDMA,怎么做到高可用?
国产云数据库厂商在解决可用性与一致性、高并发性能、弹性可扩展等问题上,还有很多难关要过,同时面对云时代的多样化趋势,还要探索新一代分布式数据库产品,数据库还有很长的路要走。
END
(0)

相关推荐