星环科技王天青:我人生中的转折点都是追随技术变革|TGO专访
王天青,星环科技数据云平台负责人,国内资深云计算专家;
2003 年起,先后在中兴任系统工程师、EMC 最高任主任研究员、麻袋理财任首席架构师、DaoCloud 任首席架构师、产品副总裁;
2020 年 8 月,加入星环科技,任云开发部高级经理,负责星环新一代智能大数据云平台 Transwarp Data Cloud (以下简称 TDC) 研发,工作期间 20 多项专利获得中国专利局和美国专利局授权,并参与撰写了《云原生时代,容器云的技术发展趋势》(InfoQ 和星环科技联合出品)报告。
每个人的一生都有几个关键的转折点,那几步走好了,以后的路就会顺畅很多。对于普通程序员来说,他们最关心的可能是如何在技术这条道路上走得更远,要么向管理者精进,要么转向产品或咨询,再或者就是创业。
哪有什么天上掉馅饼,一切都是追随技术变革。
每一个方向都不是那么容易,有时候努力和机遇缺一不可,王天青也不例外。2015 年,干了 12 年程序员的王天青,终于晋升为麻袋理财首席架构师,用他自己的话来说,一切都是「水到渠成」。
在那之前,王天青在 EMC 中国研究院(卓越研发集团,一家外企)从事了八年的云计算工作,在存储、网络、云计算、容器等基础设施及微服务架构、DevOps 等新兴技术方面有着深厚储备,同时受益于外企高效敏捷的工作方法,能够与不同国家与地区、不同时区的团队协作完成相关工作,这也为 DevOps 理论联系实践打下了坚实的基础。
当时正值麻袋理财处于业务增长期,基础设施遇到不少问题,整个业务系统需要重构,他负责运维部门进行两地三中心设计,同时将云原生的理念,在业务系统重构中实践落地。自身储备加机遇使得王天青完成了职业生涯的第一次蜕变。
第二次蜕变发生在 2019 年,王天青成为产品副总裁,这一次他从技术转向了产品。
2016 年,王天青在 DaoCloud 带领研发团队帮客户做架构规划,与客户打交道很多,在此过程中,王天青积累了丰富的产品思维和经验,三年后王天青便顺利转成产品副总裁。
王天青认为,产品的负责人和技术负责人区别在于,技术负责人核心是解决产品研发问题,分解需求、做系统设计,然后开发、测试,而产品负责人要和客户打交道,洞察客户的痛点,这个时候不能闭门造车,也不能只考虑技术,而要考虑产品价值端到端形成一个闭环。
在王天青看来,产品有产品的一套方法论,如产品地图,用户故事地图等,是需要系统学习的,而产品思维则需要深入客户去沟通,了解用户的需求,并能看到背后的本质是什么。
「同客户打交道核心是要习惯在不确定性中去找到确定性,需要 open mind,随时调整自己的想法,不能是客户说一就是一,要多问几个为什么,挖掘背后的本质。」
大数据头部玩家,武器竟是一把“尖刀”?
2020 年王天青加入星环科技,带领 30 人的团队,继续打磨已经快速成长两年多的星环大数据云平台 TDC。
星环大数据云平台 TDC 研发团队部分成员,王天青右二
王天青之所以进入星环科技,与 CEO 孙元浩有着不解之缘。孙元浩是王天青在南京大学读研期间的同门师兄弟,但两人差了两届。王天青回忆说,导师经常表扬孙师兄,印象比较深的是他喜欢记录各种各样的事情和想法,对细节掌握得非常好,到现在许多以前的事情他都记得。
来星环科技之前,孙元浩找王天青聊过几次,和他说了一个“尖刀理论”,王天青至今还记得。大概意思是 无论是一个人还是一个企业,必须要打造一个核心竞争力,有了这把尖刀,在江湖上你不管面对什么样的竞争对手,都能把它干掉。
“尖刀”理论促使王天青下定决心加入星环科技,也正是因为每个星环人都有这种打造核心竞争力的强烈意识,让星环科技一跃成为国内最顶尖的基础软件头部玩家之一。
王天青认为星环科技的核心竞争力是 底层技术思维,即技术领先、产品丰富、平台战略、自主可控。
「底层技术思维是希望让大家能够坐的住,去打磨技术和产品。星环一开始就选择走 自主知识产权 道路,而不是拿来主义。因为拿开源东西装起来虽好,但存在很多弊端,重新打造比开源社区速度更快,能更好解决技术问题。」
在自主创新的理念指引下,星环几乎每年都会产出新的产品,也不断有新的突破。
2013 年,发布极速大数据平台 Transwarp Data Hub 2.0,将大数据产品化交付给客户;
2014 年,发布极速大数据平台 Transwarp Data Hub 3.0,并推出 Inceptor 分析型数据库;
2015 年,发布极速大数据平台 Transwarp Data Hub 4.0,推出数据挖掘产品 Discover;
2016 年,星环成为中国首个进入 Gartner 数据仓库及数据管理解决方案魔力象限的厂商,且被评为最具前瞻性的远见者;
2017 年,发布划时代 Transwarp Data Hub 5.0,成为国际上首个实现大数据容器化产品;
2018 年,发布大数云平台 Transwarp Data Cloud,同年,星环科技成为 12 年来全球首个完成 TPC-DS 测试并通过官方审计的数据库厂商;
2019 年,发布分布式交易数据库 KunDB;
2020 年,参与钟南山院士团队“疫情暴发趋势预测论文”发表;
2021 年,发布极速大数据平台 Transwarp Data Hub 8.0,可通过 8 种异构存储引擎支持业界领先的 10 种存储模型;
当然,不局限于大数据、云平台领域,星环在人工智能也有布局。2017 年以来,星环在人工智能领域成果不断,研发了智能分析工具 Sophon,包括数据科学平台 Sophon base、联邦学习平台 Sophon Federation Learning 和边缘计算平台 Sophon Edge。
在储备人才上,星环科技 985、211 高校比例占总人数的 56%,硕博及以上占总人数的 41%,同时与南京大学、复旦大学等高校合作,成立联合实验室,在关键技术领域深入研究;
在博采众长上,从 CEO 孙元浩开始,星环科技研发人才大多来自国内外大公司,且团队成员都是基础软件领域底层技术的高精尖。
数据云升级 实现数据生态化
2021 年 9 月,王天青负责的星环科技的大数据云平台 TDC 2.5 版进入测试环节,正式上线已是蓄势待发。自 2018 年首发以来,TDC 几乎半年升级一次,产品新功能持续推出,性能不断优化。
星环科技 TDC 产品界面
TDC 数据云与传统云有着本质的区别,传统云计算分为 IaaS、PaaS、SaaS,从 IaaS 层面来看,传统的 IaaS 云是以资源为核心,将计算、存储、网络等 IT 硬件资源池化,以云的方式交付,解决的是资源弹性的问题;另一种云是容器云,它以应用为核心,底层基于 Docker 和 K8S 构建,解决的是企业应用快速部署上线的问题。而积累在资源池中的海量数据如何流转、如何共享是传统云和容器云都无法解决的问题。
星环科技 TDC 数据云的独特之处在于它以数据、模型和应用三者为核心,关注的是如何让资源池中的数据流转起来,应用起来,实现充分共享,从而更好地服务于上层应用。星环科技拥有多个产品系列,包括围绕数据的一站式极速大数据平台 Transwarp Data Hub(TDH)、分布式关系型数据库 ArgoDB 及 KunDB,围绕模型的智能分析工具 Sophon 等。TDC 与这些产品线的产品有机融合,使得星环数据云天然具备这种数据、模型、应用融合的能力。
依托于大数据产品线和数据科学产品线,围绕数据、模型和生命周期管理,数据云能实现数据的存取、计算、分析和展现。王天青介绍说,TDC 的优势主要体现在:
1. 率先采用容器云技术的数据云平台;
2. 创新的存算解耦技术;
3. 创新的联邦云架构;
4. 内置隐私计算能力。
TDC 产品灵感来源于客户的需求。「星环科技最早做大数据平台起家,最初客户使用星环的大数据大平台建设自己的数据湖、数据仓库,在此过程中,星环发现用户还有多租户和弹性的需求,比如企业的组织架构有多个部门,需要多个不同的数据平台方案来满足,如数据湖、数据中台、数据科学等多种平台。这些平台如果单独交付,客户的建设周期会拉长,而数据云这个底座可以把所有的平台能力快速整合在一起,基于这个底座客户可以更快速的实现各种平台建设。」
王天青认为,数据云代表了技术和行业应用发展的方向。「一方面,数字化转型需要数字化平台支撑,其核心生产要素是数据、模型和应用,但无论应用还是模型,都是对数据处理分析产生价值,因此,最终产生价值的是数据。另一方面,云原生相对于传统的云技术更轻量,提供了多租户、弹性、容错的能力。如果把数据和云原生结合,最后就会变成数据云。」
王天青:星环科技的大数据、人工智能以及数据云都是分布式系统,都有分布式系统的复杂性,因此星环科技很早就采用容器技术和容器编排技术,实现了平台的一键部署和开箱即用。以 TDC 为例,我们支持不同的操作系统和 CPU 架构,可以采用图形化的方式部署和配置异构集群。在 TDC 之上,如果用户要部署一套数据湖,我们提供了一套图形化向导方式,一步一步帮助用户完成各项选择和配置。
王天青:星环科技今年提出了一个口号,叫做“构建明日数据世界”,星环数据云的核心战略是使用云原生技术和零信任安全架构,围绕数据,模型和应用这三种数字化时代的核心生产要素,构建数据 PaaS,分析 PaaS 和 应用 PaaS 能力,赋能企业数字化转型。
王天青:云原生技术是云计算的下一步发展,因为云原生管应用,更贴近于我们的业务。如果要说云计算最前沿的技术,我觉得是和安全相关的。大家可以看到,今年 5 月,美国总统拜登签发了《改善国家网络安全行政令》,提到了"各个机构必须尽可能采用零信任架构向云技术迁移,必须具有网络安全计划服务和能力,以便在使用零信任架构的云计算环境中充分发挥功能"。与此同时,中国也颁布了《数据安全法》。现在网络安全事件越来越多,需要采取零信任安全和大数据安全两者结合的方式,让平台实现一个端到端的安全。