一位科学家最大的幸运,莫过于在年富力强的时候,实现了自己的技术使命,一家高科技企业最大的幸运,莫过于身处全球规模最大的市场,可以恣意绽放自己的创新价值。
在历史的长河中,再也没有比科学家更被低估、更易误读的群体了。他们中的极少数出现在聚光灯下,身负希望与压力;他们中的大多数默默无名,如同《冰与火之歌》的无面者;他们身负沉重的使命和沉默的荣耀,一次次登上高山,又一次次主动跳入谷底,从0到1,攀爬新的技术高峰。比起历史上很多数深藏功名的科学家,自主研发神龙云服务器架构的阿里云科学家们,要幸运许多——他们的技术成果在各行各业得到广泛应用,他们首研的解决方案被行业跟风效仿,他们还收获了应有的功名和点赞。11月23日,乌镇世界互联网大会·互联网发展论坛上,神龙云服务器架构入选世界互联网领先科技成果,这也是首次有云服务器架构入选——这得益于中国政府对于云计算产业的鼓励扶持,以及阿里巴巴集团对于云计算业务的十年深耕,还有一代代技术人员摩肩接踵的科研投入。神龙,一个浪漫的名字,其实是一项硬核的技术代号——在神龙出现之前,虚拟化性能损耗,是云计算行业如影随形的痛点。所谓的虚拟化技术,《浅黑科技》的史中曾经有过通俗的比喻,就如同变形金刚,把无数台计算机“组合”成一台超级计算机,或者把一台整计算机“切割”成无数小计算机。损耗比例有多高?一个32核的物理服务器,云厂商只能把16核或者20核给到客户,剩下的12核需要对存储、网络进行虚拟化,那么资源浪费率就在37.5%-50%区间。资源的浪费带来了成本的显著提升,而性能瓶颈也会影响整个存储、网络的虚拟化,导致稳定性的降低,正是因为无法解决这一痛点,很多企业上云之后,又兜兜转转撤回到了传统IT架构。不要以为这是危言耸听,不少头部企业也折戟于此——上汽集团曾一度计划用云计算来解决汽车仿真的大算力场景需求,但经过一番试错之后,公司大失所望,虚拟化带来的性能损失高达60%,一点不经济不合算,上云计划最终遗憾搁浅。简单来说,神龙解决了困扰云计算行业多年的虚拟化性能损耗问题,让服务器发挥出更高的性能、更加稳定。如你所知,神龙的价值仅用一句话就能概括完整,但研发神龙的过程却如同在茫茫黑夜里里寻找光明——阿里云的技术人员深入黑暗的无人区,没有逃遁之处,也没有后路可走,成功才是唯一的庇护所。神龙的总设计师是时任阿里巴巴集团首席技术官(CTO)、现任阿里云总裁的行癫——人如其名,为创新如疯如魔。当资源性损耗被行业集体默认为云计算的固有副产品时,2016年双11之后的复盘会上,行癫提出了一个“强人所难”的小目标——必须想办法把计算资源损耗降到“0”。此前,阿里云已经把虚拟化资源损耗降低到了10%——几乎是行业最低水平。从10%到0,看似只有10%的差值,但却是损耗率的∞提升,遥隔着星辰大海的距离。说都说了,就开干吧,一项代号为“X-Dragon”的神秘项目就此启动。一年后的云栖大会,“神龙云服务器”首次亮相,不是PPT上的概念或者实验室的内测版本,是可以量产的现货。通过自研的硬件模块,阿里云将外部云盘存储、VPC网络等资源offload到专属硬件芯片上,彻底消灭了虚拟化性能损耗问题,高效发挥了物理机100%的性能,同时还拥有虚拟机的弹性和分钟级交付能力。神龙,是阿里云在无人区探索的终有所成,艰难寻路的过程中,他们一直以为只有自己踽踽独行。却没有想到,大洋彼岸的亚马逊AWS也惺惺相惜,勾画出了同样的平行线,在神龙亮相一个月后,亚马逊发布了他们自己的类神龙虚拟化架构——名为 Nitro。转眼三年过去,到了今天,全球也仅有阿里云和AWS实现了虚拟化零损耗,打造了云端芯边全链路融合、软硬一体化的新范本,新生态。东西两个云计算巨头的殊途同归,可谓是英雄同路,所见亦同——只是这一次,一直作为追赶者的阿里云,抢先进球得分。短短三四年间,“神龙”一直快速迭代。2019年推出的第三代神龙架构在多个关键指标上提升5倍性能。而今年7月亮相的第三代神龙云服务器,再次将算力逼向极限,相比上一代整体性能提升了160%,在多项性能参数中斩获世界第一。基于神龙架构的云原生裸金属容器,QPS提升了30%,计算成本下降50%,安全容器的性能也提升30%。神龙见首,一飞冲天。从此,云计算可以彻底甩掉高损耗的帽子,各行各业腾空凌云的最后一块挡板被彻底搬开,一年超过10%的巨大云端算力重新释放到各行各业,为社会创造生生不息的价值。因此,神龙获得国家盖戳点赞,其实并不让人意外,学霸阿里云年年绩优也是常态——连续五年当选世界互联网领先科技成果,此前入选的有阿里云飞天操作系统、阿里云ET大脑、supET工业互联网平台和PolarDB数据库等等。阿里云的科学家们,可以俯首甘当深藏功与名的“扫地僧”,但他们的技术成果绝不能束之高阁,封尘蒙土。曲高和寡也绝不是阿里的做派,目前,数百万台阿里云服务器搭载着神龙架构,已经覆盖了近300种场景,深入庙堂之高、江湖之远、基层之末,行业之本,成为数字化时代的硬核技术担当。
在内部,神龙云架构已经在淘宝、天猫、菜鸟、钉钉等业务中大规模应用。依靠神龙架构,双十一的技术极限值一次次被打破,高峰时期每秒处理的数据流量总数,从去年的25亿条提升到今年的40亿条,订单创建峰值也提升至58.3万笔/秒,阿里云又一次扛住全球最大规模流量洪峰,再也没有重蹈卡顿的覆辙。与此同时,资源损耗率和资源成本却一次次极限压低——过去四年,阿里云让双11的交易资源成本平均下降80%,研发运维效率平均提升20%以上,规模化应用交付效率提升100%。今年疫情期间大火的钉钉则是最新的受益者。疫情之后,钉钉的访问流量倍数级增长,短短2小时内,钉钉就新增部署了超过1万台云服务器,这个数字也创下了阿里云上快速扩容的新纪录,当同样流量暴涨的ZOOM深陷崩溃之苦时,钉钉的使用体验却如丝绸般流畅平滑。而在外部,过去一度惧于损耗率过高,无奈跳下云端的上汽集团,以及独角兽旷视科技等等,也再一次漫步云端。上汽通用使用神龙SCC超算集群后,汽车仿真计算效率提升25%;吉利汽车通过使用神龙云服务器集群,显著提升仿真效率近三成,缩短车型设计和推出市场时间若干个月。不仅为企业所用,民生服务、智慧政务、医疗健康、司法公安等等,稳如磐石、动如神龙的阿里云,已经如同空气一样,支撑各行各业驭风乘“龙”,冲上云霄。于宏观层面,云计算也带来了实实在在的社会价值,社科院财经战略研究院和阿里云研究中心联合发布《云计算的社会经济价值和区域发展评估》报告显示,以云计算为代表的新基建对GDP的拉动效果是传统基建的1.2倍;根据测算,阿里云已为社会节省超过2000亿IT成本;未来5年,云计算还将持续担当起保就业的大旗,至少为全社会带来300万个就业机会。反哺社会的同时,也是自我实现的过程,有了神龙加持,阿里云继续飞升——7月21日,国际数据公司IDC公布2020年一季度中国公共云市场数据,阿里云排名第一,市场份额达42.4%。纵观阿里云的十年历史,神龙云服务器架构,既基于阿里内在的创新驱动,以及前端业务发展的倒逼刺激,也离不开宏观政策的扶持鼓励。早在2015年,国务院印发的《关于促进云计算创新发展培育信息产业新业态的意见》就提出,到2020年,中国云计算应用要基本普及,云计算服务能力要达到国际先进水平,形成若干具有较强国际竞争力的云计算骨干企业。五年过去,阿里云不辱使命,荣列全球云计算三强,与亚马逊AWS并肩而立,在某些技术指标和创新进度上,甚至实现了诸如神龙云架构的赶超,阿里云已经成为了中国创新的典型样本和技术名片。今年疫情之后,新基建、双循环等勾画了中国经济发展的主通道,各行各业涌入云端的速度将会再次提速,根据预测,2023年,90%的企业新的应用会通过云原生的方式部署。未来十年,中国市场的广阔天地里,阿里云依然还要大展身手。可以说,阿里云就是典型的中国式创新的样本——企业自我驱动,顶层设计鼓励,快速应用落地,赶超全球巨头。龙的传人,让“神龙”从神话中照进现实,从一行行代码,一枚枚芯片,一块块板卡,一台台服务器里一飞冲天——在中国,技术得到追捧,科学备受鼓舞,创新根植沃土。一位科学家最大的幸运,莫过于在年富力强的时候,实现了自己的技术使命,一家高科技企业最大的幸运,莫过于身处全球规模最大的市场,可以恣意绽放自己的创新价值。天空给了星辰明月灿烂的机会,星辰明月又反身照亮了天空。