阿里云难『触顶』
作者 | 王刚
出品 | 雷锋网产业组
每年双十一是观察阿里云的最佳窗口。
今年更是如此,用阿里巴巴CTO程立(花名鲁肃)的话来说,今年双十一,阿里把全副身家性命都放在了云上。
作为阿里巴巴集团级的大项目,淘宝/天猫双十一在过去11年间为阿里带来了巨大的收入和名声,而促销活动背后的互联网超级流量峰值,直接催生了今天国内云计算的第一名。
一次次阿里的“大树修枝”,把阿里云凸显在最前方,换帅、升级云智能、达摩院技术加持、吸收钉钉、聚合阿里AI Labs······在最新一季财报中,阿里云已经稳定在集团营收第二的位置,营收占比提升至10%,无比高光。
连续两年天猫双十一交易峰值,图源:雷锋网
数据显示,昨天的天猫双十一,阿里云又一次扛住了全球最大规模流量洪峰,仅在0点刚过26秒,天猫双十一的订单创建峰值就达到58.3万笔/秒(这一数字是2009年第一次天猫双11的1457倍),刷新纪录。
阿里云的故事,仍然是巨头阿里的最好技术脚本。在亏损收窄的境况之下,阿里云继续成为云计算头牌、阿里的王牌。
关键一问是:从双十一“出走”的少年,阿里技术体系里阿里云的“挑战”是什么?高速的增长背后,阿里云会触顶吗?如何抛开过去的故事“去明天”?
1
Hold住阿里“最大硬仗”
2009年春天,阿里云的同学在帝都北京的汇众大厦里写下了云操作系统“飞天”的第一行代码;同年秋天,淘宝商城启动双十一促销。这两件在当年都是“不重要的小事”。一个只是商业手段的推陈出新,一个只是技术故事的起始。
11年后,这两样事物已经被深度捆绑。互联网的巨大流量裹挟着一切向前,两只巨兽诞生。用程立的话来说,双十一是高能粒子对撞时刻,撞出的是最大的创意火花。
无疑,巨大的网络流量洪峰,每年都定格在那个俗称“光棍节”的0点时分,而这件事成为阿里一年中最大的硬仗,是堪比攀登珠峰的冒险。
这场硬仗,不为人知的幕后主力是超过60000名阿里巴巴的工程师。业务“倒逼”着技术突破,挑战一年胜过一年,阿里的技术也因此突飞猛进。
备战双十一,过程艰辛。今年,阿里技术团队的玩法与众不同。
就在第一轮双十一(今年设置两轮售卖期)接近尾声之时,阿里发布了双十一10大前沿技术,包括小蛮驴、实时直播翻译、虚拟主播、阿里语音机器人、OCR无障碍购物、工业视觉、运维机器人、全面云原生、认知智能引擎、液冷数据中心,渲染出了浓厚的技术气息。
对于狂欢节的流量安全防护,各大电商技术团队似乎也已轻车熟路。备战中,阿里技术团队研发出一个能一键对内部技术体系发起实时攻击的APP,通过对线上一次又一次真实的内部突袭,来验证在真实故障场景下,阿里的系统在容灾、容错等方面的表现以及阿里在突发场景下的应急协同。
这个APP支持发起针对内部各个BU的精准突袭,也支持发起随机性的突袭。突袭背后,阿里已经在整个经济体内部推广日常的“红蓝对抗”。
技术蓝军负责设计突袭弹药、在不经意时发起突袭,技术红军负责在极短时间内解决故障。通过团队无数次的演练,阿里的电商业务承诺可用性达99.995%,意味着一年中只有26分钟不可用——突袭演练的目标是可用性进一步提升,将一年不可用的时间降低为分钟级。
“自虐式”的突袭看似很疯狂,但其对系统的作用可比疫苗引起的免疫反应:故意将微故障注入系统以提前训练系统的响应,类似于在可控条件下将有害物质注入体内以防止未来疾病。这一机制能让阿里提前为包括宕机在内的各种故障做好准备,将其影响降至最低。
2
双十一大协同背后的云+中台
“数据中台”,被阿里副总裁、数据中台负责人朋新宇(花名小芃)形容为“确定性的创新增长引擎”。
在朋新宇的口中,阿里数据中台的目标角色是“每一个商家的参谋”(双十一期间)。今年要做的是坚持安全和开放两条腿走路,并要把生态搭起来。言外之意是,从电商数据中台要进化到商家全域数据中台(阿里域+非阿里域)。
阿里云基础设施+数据中台,图源:雷锋网
今年,中台能力上,阿里上新了“新计算框架:流批一体化”,对离线数据和实时数据做到一体化处理,计算上快了1倍,资源成本节省1半。
雷锋网认为,从技术、组织架构的实现,到向行业传递概念,最先的实践者和最大的受益者都是阿里电商。这在双十一里也表现得尤为明显。
阿里中台事业群创立于2015年,但实际上相关积累要早于这个时间点,据此前朋新宇介绍,在2015年阿里公开提出“大中台,小前台”中台战略之前,他们已经干了三四年了。关于“大中台、小前台”,阿里董事会主席兼CEO张勇的阐述是:
构建符合DT时代的更创新灵活的“大中台、小前台”组织机制和业务机制:作为前台的一线业务会更敏捷,更快速适应瞬息万变的市场;中台将集合整个集团的运营数据能力、产品技术能力,对各前台业务形成强力支撑。
2019年12月19日,以阿里数字经济体三大战略“全球化、内需、大数据和云计算”为核心,阿里宣布新组织升级结果,蒋凡、胡晓明、程立等一批青年领导层进一步晋升。此次组织升级中,阿里云总裁张建锋(花名行癫)卸任阿里集团CTO,但仍统筹阿里技术的发展。程立将担任阿里集团CTO,二者承担起打造阿里技术大中台的重任。
马云、张建锋先后不断“安利”的中台,被程立形容为“阿里内部的一场思想突破”。尽管业界在2018-2019年对中台产生过诸多质疑声,但阿里内部依然当作重要项目予以推进。阿里中台事业群几位关键人物,如今多有变动:张建锋担任了阿里云总裁、达摩院院长;谷雪梅(花名康朵)当了菜鸟CTO;墙辉(花名玄难)离职后创办了来未来科技,刚刚融资千万;朋新宇于2016年出任友盟+CEO,但数据中台业务未脱手。
让外界疑惑的是:阿里云和中台是不是重复建设呢?其实不是的。
阿里巴巴集团前端数十个业务单元(如淘宝、天猫、聚划算)并不是独立地构建在阿里云之上,在后端阿里云技术平台和前端业务间是“共享业务事业部”,将阿里巴巴集团前端业务中公共、通用的业务沉淀到了这个事业部,包含了用户中心、商品中心、交易中心、评价等十几个中心。
阿里云和中台两者有着类似使命,属于协作的关系,“共享经济”理念推动两者天然相近,技术角度上,云计算也是中台业务落地的土壤。随着去年到今年全部核心业务云上进行,中台与阿里云的融合更加紧密。
3
技术迭代的“关键先生”
中台是阿里技术理念大创新,回归阿里技术路线更迭本身,也多数与阿里云有关。
2010去IOE,2013飞天5K/登月工程,2015中台战略全面实施,2017成立达摩院机器智能驱动双十一,2019核心系统100%上云,2020数字原生商业操作系统······
以“自我革命”的姿势推进变革,是阿里的一贯作风。阿里云创始人王坚博士很早就告诉马云“未来快速增长的业务,会导致IT基础设施成本拖垮阿里”,这一定程度上坚定了阿里做云计算的决心,江河解冻势不可挡。
2019年,阿里把核心业务100%搬到云上,做到了核心系统的云化。这一动作的出发点在于打通IT架构,基于此做数据智能化。
多年来,阿里在内部推统一技术,各子公司、子单元都有很多独立的系统和技术,而统一的最好手段是什么?云化。大家都在云上,解决技术统一问题、数据统一问题,在云上完成。
不过,在张建锋看来,全面上云还只是一个技术性阶段,把原来基础设施从非云升级到云,而重构云需要关注的面更广,在完成 IT 基础设施“上云”的基础上,包括理念升级、组织升级、经营模式和运营模式升级。
推崇云原生的逻辑,产生了。
4
埋下云原生的“种子”
出生在近十年的孩子,已经是数字世界原住民,他们带着对数字原生的理解与思考,会怎样设计我们的商业与社会?
这是阿里CTO程立的一个提问。
“云原生”的出场基调,其实有一定的时代背景。
今年云栖大会上,除了云手机“无影”、物流机器人“小蛮驴”的刷屏,另一个似乎热度被掩盖但影响力重大的事件是:阿里成立了云原生技术委员会,并将云原生确定为阿里新的技术战略。
阿里巴巴云原生技术委员会9位成员
既然是“升级”,证明了“云原生”不是突然出现的技术名词,只是在阿里新的技术挑战下,做了一次放大。
简单来说,云原生的技术体系,被视为云计算的未来方向。这一技术之下,开发者无需考虑底层的技术实现,只需做好自己的业务,云的弹性+分布式优势最大化。
“今年是下一轮双十一的起点”——这是程立一直强调的一句话。而下一轮起点的核心动力在哪里呢?实际上就是云原生。这次双十一,比如阿里数据库交易核心就全面实现云原生了,计算资源利用率提高60%+。
阿里之所以强调自己有着10多年的云原生实践,是不无道理的。
云原生负责人丁宇介绍双十一核心系统全面云化概况,图源:雷锋网
回到双十一,有着巨大体量的淘宝/天猫在系统架构上已经做得足够好了,因此在应用层就自动屏蔽了很多因为基础设施层面故障导致的业务问题,所以,“丝滑”一词被双十一期间的云厂商大力渲染,代表的就是商家和消费者对底层问题的无感知(访问不卡、网络不慢)。
但是,云计算自商业化以来,外部客户千差万别,从底层到平台到应用,技术水平参差不齐,底层机房等硬件小故障都可能命中客户业务应用,致使服务受影响。云原生抽离出来的更加标准化的能力,实际上对业务帮助更大。
对外部客户是“全速重构”,对阿里本身也是这样。比如张建锋在去年提到的“做深基础”,背后逻辑不是简单替换,而是基于云的特点来构建整套基础体系。就像当年阿里巴巴“去IOE”并不是做一个新的小型机替代了旧的小型机,而是用云计算取代了传统的 IT 基础设施。
云原生,下的是一步大棋,阿里为此提炼的新策略是“数字原生操作系统”。
阿里巴巴数字原生商业操作系统,图源:雷锋网
阿里是不是又在兜售概念?看系统架构。阿里的使命是“让天下没有难做的生意”,其驱动逻辑是商业操作系统,基于云的最底层技术,加上4个中台的能力,来对最前端的商家和消费者服务。
除去“商业”的范畴定性,也就是阿里云声称的1.0过渡到2.0,由简单狭义的“飞天”云平台,变成一个既有云、又有数字原生操作系统的一个复合型平台,而两翼则是“云钉一体”和“云端一体”的布局。
5
“云钉一体”组合拳带来想象力
一切新闻都不是突然发生的。于阿里云,技术换挡是常事,但业务上的调整更具热度。
“云钉一体”这个词刚出现的时候,业界多少有些错愕,其背景有两个:第一个动作是钉钉被划入阿里云智能事业群,第二个动作是钉钉CEO无招(陈航)不再担任钉钉掌门人,集团对他“另有任用”。
钉钉一直是阿里TO B的明星级产品,是阿里技术和生态的大触角,并入阿里云,不仅是集团对阿里云/钉钉定位调整,也是阿里一直强调的“建设商业生态系统而不是商业帝国”的思想在组织结构上的落地实施。
2019年3月阿里云峰会北京站,阿里云总裁张建锋如此描述阿里云智能的自我定位:
“云智能升级之后,所有的技术输出、产品输出、对 B 端的服务都必须通过阿里云智能平台,包括像钉钉这样的协同办公系统,新零售的核心技术和新产品。”
这个论调,其实也基本为后来钉钉并入阿里云埋下伏笔。话音落地3个月之后(2019年6月),阿里架构大调整,正式对外宣布对钉钉的建制安排:进入阿里云智能。2020年9月27日,阿里公布新一轮战略部署:将钉钉升级为大钉钉事业部,与阿里云全面融合,并整合集团所有相关力量,确保“云钉一体”战略全面落地。
“云钉一体”的战略位置
“云钉一体”的背后,是阿里云本身“不做SaaS”交给合作伙伴做、钉钉更偏PaaS平台吸引开发者的逻辑,从“商务沟通工具”进化到“办公平台”,再到阿里云智能业务的“操作系统”,钉钉用了6年。
如今,“云钉一体”和“云端一体”就是数字原生操作系统的核心组成部分。“云钉一体”下连阿里云基础设施,上承客户的各种应用,必将改变云的使用方式、应用的开发方式。
在关于阿里云和钉钉的关系上,张建锋将之比喻成PC和Windows,阿里云负责计算架构,钉钉提供平台(企业在上面开发管理组织和业务应用)。而操作系统的典型特征是:自己做一部分事情,开发者在上面做更多的事情。
钉钉现有业务数据,图源:雷锋网
截止到现在,钉钉上已有超过3亿用户、1500万组织、超过20万的开发者,钉钉应用市场上,软件开发商年交易额增长超过800%。这些数据对阿里的“云钉一体”战略来说,的确是一个不错的结合点。
云计算本身就是将服务器、存储、网络等硬件资源加上操作系统、数据库等软件资源打包,变成社会化资源,过去多年,中国都在追求核心高端基础软硬件自主化(芯片、数据库、操作系统),行路曲折,用全新的服务模式卖云,难度可想而知。
一直到今天,中国的云计算生态广泛聚焦在IaaS领域,SaaS领域市值1000亿的公司是没有的,难得出了一个钉钉,势必融进阿里技术大系统。
从国际3A的竞对格局来看,微软的Azure云与Office等办公产品深度打通,AWS客户可以经由企业远程协同工具Slack管理AWS云资源。反观,阿里云有1500万组织用户,其中1300万都是中小企业,钉钉为阿里云走进传统产业开辟了一条宽广的路径,“云钉一体”打开了阿里云增收的想象力。
6
不要神化阿里云
尽管国内第一的排名让人艳羡,不过不要神化阿里云,阿里云也是一小步一小步做到今天,在阿里动物园这个大熔炉里,势必会锻造出一把利剑。
公司大不一定能把技术用好,但用好技术,公司才有做大的可能——这点,于阿里,于阿里云,都同样适用。
阿里云2021财年Q2营收数据
经过11年发展,阿里云已经拥有300款产品,2021财年Q2营收达到149亿元。这不开这几年阿里的技术投入:在不久前阿里巴巴全球投资者大会上,阿里CFO武卫首次披露,阿里在技术和研发上的投入每年都超过1000亿元。今年4月,阿里云宣布的“未来3年将再投2000亿元用于新基建”,预计也大多来自集团资源的注入。
对研发的重视,也促使阿里营收结构得以进一步优化。从业务营收占比来看,阿里云计算业务已经稳定在第二的位置上,此外云的亏损在逐渐收窄,盈利前景乐观。
新财报发布后,阿里董事会主席兼CEO张勇表示,阿里巴巴将会续聚焦于内需、云计算和大数据、全球化这三大长期增长引擎,从而更有效地把握消费者不断变化的需求,以及阿里巴巴数字经济体内各业务加速数字化所带来的机会。
细心的人会发现,最新财报季对“内需、云计算和大数据、全球化”三大引擎的排序相比2019年12月的战略升级时是有所变化的(当时排序是:全球化、内需、大数据和云计算),除了在收入数据上“论资排辈”,云的地位被更加拔高,内需市场机遇点也在放大。
整体而言,2020年双十一是阿里史上最具科技含量的双十一,这一点没错,在天猫订单再破记录以及两次流量高峰情况下,阿里技术做到了淘系产品技术负责人、双十一集团技术总指挥的汤兴(花名平畴)所说的那8个字:“稳如磐石、不动如山”。
今天,做云计算比保障双十一要难得多,双十一基本对阿里云构不成任何“挑战”了。云计算的蓝海市场,将进一步考验这家巨头。当务之急仍是继续稳脚跟占份额,规模化后的经济效益才是颠覆性的。
回到起点再想一想,既然“去明天”3个字是阿里内部启动双十一的会议代号,那阿里云,又将如何“去明天”呢?