星环科技的“星图解密”:只有偏执狂,才能让中国基础软件打破对国外进口的依赖
大数据产业创新服务媒体
——聚焦数据 · 改变商业
孙元浩是个《三体》迷。
在《三体》的宇宙世界里,有一艘飞船,可以遵循着一种原始的超光速航行方式——曲率驱动。这有点像是飞船坠入黑洞的过程——前方的时空弯曲得更厉害,后方的时空弯曲的则较少。
但正因为如此,飞船才会把它后面的一部分空间熨平,让自身以无线接近光速的速度航行。
但如果人们把对速度的渴求换成数据的运转,你就读懂了星环科技。
图丨星环科技创始人兼CEO孙元浩
8年来,其实星环科技就做了两件事:一是不眠不休地描绘出了一副大数据与人工智能基础平台的“星图”;二是基于此,不断扩展星图里的四大版图——分布式关系型数据库、数据开发与智能分析、大数据基础平台、大数据云平台,并不断找到其中的真知和宝藏。
在这副星图上,你至少能找到三层价值。
现阶段,大多数典型的大数据综合平台主要是基于Hadoop实现的。2008年7月,Hadoop打破世界纪录,用时209秒,成为最快排序1TB数据的系统,2009-2010年,随着云计算的建设,Hadoop开始用于数据存储和离线分析。
但Hadoop并不是没有局限的,孙元浩告诉数据猿,最初星环科技的产品主要也是基于Hadoop和Spark实现的,但后来发现,当数据量大于100TB时,Hadoop可以成为唯一的选择,可当数据量小于1TB时,Hadoop的性能就仅为MPP数据库的1/15~1/10。
这都是由Hadoop自身架构的局限决定的。孙元浩并不希望追随,他想以“突破“的方式,做到世界领先。
只是在当时,做这个选择,明显是“冒险“。
现在让我们调转镜头,来看看在大多数数据平台公司一边吐槽,一边选择追随Hadoop的时候,为什么平行时空里的孙元浩会做出不一样的选择?
要回答这个问题,首先,先让我们先来看一张星环科技大数据架构演示图。
这是星环科技产品体系发展历程图,略作解释:完全进行了重构的大数据平台之外,星环科技已经发展出了四大产品品类,涵盖数据生命权周期管理。
而完成这一重构的过程,就用了6年。
事实上,TDH技术既是星环科技最早诞生的产品,也是它的基础产品。可以说,星环科技的其它品类都是围绕这个产品做展开增强的。
但是星图为何要做这种费力不讨好的事情?这也是我们接下来要说的第二层。
星环科技的商业模式是为企业级提供大数据方案。
这些围绕企业数据服务的产品方案就像一座冰山,目前已知露出水面的有:数据仓库、数据集市、实时计算、信息检索、人工智能、知识图谱、反欺诈、云边一体……
而这些方案的根基都是TDH系统。
2021年3月24日,孙元浩在春季新品发布会上宣布,将TDH升级到8.0版本。新版本可以支持8种存储引擎、10种存储模型,支撑用户各种高阶的数据分析场景。
那么问题来了,为何星环科技要以每年务必迭代一次的速度,去不断升级这个系统?
以Data Hub5.0为例,2017年,星环科技在升级版的基础上,做到了大数据产品容器化。什么叫大数据产品容器化?通俗点解释,它就是将数据的各种功能放在一个集装箱里,当客户想要使用,直接拿走集装箱即可,而这就大大简化用户的操作难度。
尤其让国人骄傲的是,直到两年之后,同类型的美国公司才意识到了容器化的好处,开始做大数据的容器化。但此时,星环科技已经占据了部分市场。
所以,星环科技的第二层其实很高级,第一层是为实现第二层打地基的。这就好像一个人要做成一件事,就要抓住一种细分需求,但显然,他并不能通过做大多数人都在做的事,来满足这种特别的需求。
其实这也是孙元浩所提出的“只有偏执狂,才能让中国基础软件打破对国外进口的依赖”的原因所在。
事实上,过去八年间,星环科技为客户所开发的原创技术创新,数不胜数。由于涉及多年的变迁,在这里,来放放一个目录:
· 2015 年,星环科技攻克了分布式分析型数据库的关键技术难点,成功替代了 Teradata 等国外厂商构建数据仓库;
· 2016 年攻克了复杂批处理的实时引擎融合历史数据与实时数据处理技术难点,实现了复杂计算的实时流处理;
· 2017 年采用容器编排技术实现大数据分析的弹性服务;
· 2018 年实现了数据集市、数据仓库、数据湖一站式分析融合平台;并且成为了国际上第一家完成 TPC-DS 测试的大数据公司;
· 2019年革命性的采用星环云操作系统来融合数据PaaS、应用PaaS、分析PaaS,实现数据、应用、智能分析融合。
而在2021年,在星环科技的春季新品发布会上,它这一年实现的技术突破更是各条业务线遍地开花。
包括:
· 发布了 Transwarp Data Cloud 2.0 数据云、全链路 AI 平台 Sophon 等产品;
· 将模型数据管理平台升级TDH 8.0,实现了八种存储引擎支持十种存储模型;
· 发布了一站式数据开发与治理平台 Transwarp Data Studio 2.2 版本,这个新版本可以实现数据的全生命周期管理能力;
· 发布数据云TDC 2.4 版本。为企业在一个 PaaS 平台上提供包括数据仓库/数据湖、数据治理、数据智能与分析、数据交易与共享等在内的完整的数据解决方案;
· 推出了一站式人工智能基础平台Transwarp Sophon 2.7 LTS。为企业提供数据、支持从数据导入、数据探索、数据预处理、特征工程、模型训练、性能验证、模型部署、模型管理的全流程;
· 推出了两款自研的关系型分布式数据库的最新版,一款是具备多模型、联邦等特性的高性能分析型数据库ArgoDB 3.0;另一款是支持SQL标准语言的国内领先的交易型分布式数据库KunDB 2.0。
可能以上的内容有点抽象,但这样的思维背后其实包含着一个策略。在商业模式上,一般人可能会寻找那种“非对称回报”的机会,即那种“失败了损失很低,但一旦成功回报巨大”的机会。但星环科技还有一种思路更为开阔的观念——那就是长期积累,心中有数。
怎么讲?如果大方向是对的,又能实现落地,那么长期来看,所有的投入就是一个“失败了仅有一点点现象回报,但成功了却有巨大的指数回报”的模式。
为了说明这点,下面我们就来说点案例了,而这个案例,就涉及到星环科技第三层星图里的重点方向——强大的产品落地能力。
2020年,国家发改委多个部委提出了“新基建”的概念。一夜间,大量资本开始涌入。
尤其是在后疫情阶段,足够多的技术积累,足够大和足够紧迫的市场需求,在一个极短的时间内集聚,这一切都推动星环科技进入快车道。
此时,一个真理不言而喻:在企业完成数据储存建设的周期之后,它们对数据存储的功能需求也在不断地演进,这也是为什么孙元浩说“大数据技术才是企业未来的核心竞争力。”
不过在大趋势尚未明朗起来的时候,这家公司也为“太过超前的判断力”的选择付出过代价。
2018年,星环科技推出了一款面向高性能闪存研发的新一代分布式关系型数据库——ArgoDB,但当时的硬件水平无法满足这种需求,最后,孙元浩只能无奈笑称:“当时我们将英特尔的技术想得太厉害了。”
但是随后的故事大家都知道,2020年,“新基建”的概念提出以后,多模型数据库已成为许多企业技术架构的最佳选择。
更具有前瞻性的是,在当时市面上流行的四种技术途径中,星环科技选择了实现难度最高,但是后期开发最方便、运营最便捷、兼容性更强的路线。
而后证明,这次上帝之手般的操作,除了让星环科技成为本轮技术革命的先行者,还直接启发了华为、阿里等国内厂商看到了这种路线的好处,随后参与其中。当然,作为先发者,星环科技享受到了很大的先发优势。
尤其是在越来越多的中国企业看到了国产软件的优势之后。
接下来,我们可以拿中美两国的软件做个比较。星环科技的TDH大数据平台支持全部主流数据模型。但IBM的 DB2则不支持Key-Value、Search Engines等数据类型;其他大数据平台也都有不支持的数据类型。
这样的差距,也让很多中国客户的思维渐渐开始转变。以中化信息这家公司为例。这家2017年成立的年轻公司,前身是中国最大的外贸企业——中化集团的信息技术部,它承担整个集团的信息化建设和数字化转型。
那个时候的背景是,中化信息想解决的问题有:
问题一:把更多的内部资源以及外部资源整合在一起。希望任何人能够在任何时间、地点、使用任何设备都能访问自己的信息化服务;
问题二:中化信息原有很多内部系统,希望新的系统不被原有的技术平台困住,换句话说,一个综合的平台上能够同时长出几个应用。
当时,中化信息把国内外众多最牛的知名供应商清单拉了一遍,最终选择了星环科技。中化信息业务应用事业部副总经理李静告诉数据猿,他们之所以选中星环科技,是因为以下几点:
一、星环科技的存储和计算上能满足客户的要求,不管是硬件的支持还是软件的支持,都可以提供这种稳如磐石的航母功能;
二、作为一个能够把所有数据类型都能纳入的平台来说,第一需求是足够安全。而星环科技的技术可以像护卫舰一样对其保驾护航;
三、由于中化集团采取的多客户模式,他们认为星环科技的产品可以同时满足中化不同业务版块的不同要求和形态。
其实,在案例的背后,我们可以看到,数据公司的耐心和专业是一种多么难得的品质。
其实,曾经涉足过这一领域的企业有很多,但因为理念和时机不凑巧,都最终被市场淘汰。相比之下,星环科技却因为对这个领域有着真正的了解,才有信心下注。并提前好几年进入了下半场。它慢慢走,稳如钟,在最终这个最重要的细分领域,得到了充足的竞争力。
在2021年的春天,在星环科技新品发布会上,数据猿有幸探访了这只团队的大牛,听到了孙元浩讲述团队的过往、梦想。听到了他们的客户徐徐讲述自己对星环科技的信任。
在这些故事里,这只企业八年来的漫长征途,在孙元浩的嘴里都变成了轻盈的序章。
正如他最爱读的《三体》里所说,“你看的不是一模一样的十二小时前的月亮。在遥远的,追逐的漫长旅途里,那月亮已经跨越了喧哗的浅水与静默的深洋。”
这正是星环科技的浪漫主义。
这是一个永远未完待续的故事。
文:王晓坤 / 数据猿
●上一篇精彩好文:
天上无人机,地下无人车,1500亩棉花可获纯利220万!极飞科技的星辰大海:用高科技赋能中国农业
联系数据猿
北京区负责人:Summer
电话:18500447861(微信)