TigerGraph:从技术产品化到产品商业化

在大数据技术迅速发展和企业数据处理复杂化的大背景下,图数据库已经成为当下成长最快的数据库分类。

对于或许是当下图数据库领域最炙手可热的新兴公司TigerGraph 而言,2017 年是一个重要的“转折年”。这一年年底,TigerGraph 完成3100 万美元 A 轮融资,这也是图数据库历史上规模最大的几轮融资之一;与此同时,其推出了TigerGraph 的通用版—服务于企业级应用的全球首个也是唯一的企业级原生并行图数据库,图数据库云服务,和GraphStudio — TigerGraph 的可视化软件开发工具包。A 轮融资的完成与通用版本的发布也正式宣告TigerGraph 结束了逾5 年的产品研发“隐秘模式”,开始走向商业化。

对于或许是当下图数据库领域最炙手可热的新兴公司TigerGraph 而言,2017 年是一个重要的“转折年”。这一年年底,TigerGraph 完成3100 万美元 A 轮融资,这也是图数据库历史上规模最大的几轮融资之一;与此同时,其推出了TigerGraph 的通用版—服务于企业级应用的全球首个也是唯一的企业级原生并行图数据库,图数据库云服务,和GraphStudio — TigerGraph 的可视化软件开发工具包。A 轮融资的完成与通用版本的发布也正式宣告TigerGraph 结束了逾5 年的产品研发“隐秘模式”,开始走向商业化。
许昱选择了一条开发周期长但是能保证产品高性能的路径, 从起步阶段设计产品原型就追求“原生”和“并行”。

2012 年,认为图数据库即将迎来发展节点的TigerGraph 创始人兼CEO 许昱放弃在Twitter 的期权,邀上曾经的同事一起研发图数据库产品。许昱是大数据和并行数据库系统领域的实力技术派,早年曾在著名的数据分析巨头Teradata 担任Hadoop 架构师;创立TigerGraph 之前,则在Twitter 的数据基础设施部门负责大规模数据分析。

通过近两年的产品商业化落地和市场推广, TigerGraph 的成熟技术已经被蚂蚁金服、VISA、软银、中国国家电网公司、Wish、Elementum 等客户所采用。眼下,在技术和市场上均获得认可的TigerGraph,正全面加速商业化拓展,并结合市场需求完善产品服务。

产品驱动

图数据库并非一种存储图片的数据库,而是应用图论存储实体之间的关系信息。简单来说,图由顶点和边组成,顶点也称为节点,一个节点则代表一个实体,边则是指关联各个节点的关系,图数据库也就是存储节点与他们之间关系的数据库。

相对于传统关系型数据库依赖大量的各种关联表,存在计算缓慢、查询复杂等缺点,图数据库以关系包含属性这一功能能够提供更为丰富的关系展现方式,而且在计算模型和查询方式上也更为准确和灵活快速。因此,Google、Facebook 和Twitter 很早就使用图数据库和分析来理解用户之间的关系。比如谷歌搜索时都会用到的谷歌知识图,国内淘宝的产品推荐也都来自图分析查询。

TigerGraph 并不是第一个研发图数据库产品的企业,而且,作为图数据库源起的图理论在两百多年前就已经问世,但是一直受限于技术的发展,没能被大规模商用;此外,长期占领市场并备受企业欢迎的关系数据库也间接制约了图数据库的发展。许昱告诉《世界经理人》,2012 年是一个“小节点”,企业需要处理的数据量越来越大, 业务越来越复杂,传统关系数据库的一些弊端在市场新需求下愈发凸显,这也间接助推了图数据库的发展,市场需要的是一款能切切实实解决企业业务问题的图数据库产品。

因此,许昱早期就对自身角色的定位很清晰, TigerGraph 不是要创造一种特别的或者新的商业模式,而是要从产品出发,成为一家产品驱动的公司,靠产品的优异性能来取胜。

基于该清晰的自我定位,TigerGraph 在2012 年起步时就专注于产品研发和验证。一是做产品原型,在产品基础上去融资。许昱表示,好想法不能光靠嘴说,得反映在具体的产品上,让懂市场的投资人能理解产品,并进一步看到该产品的市场前景。二是通过早期客户验证产品,在性能上获得认可,保证确实能解决企业的具体业务问题,在解决市场痛点的基础上加速产品创新。

许昱指出,当时市场上一些追求“短平快”的公司,流行选一个关键值的数据库、文档数据库或者关系型数据库,基于它们来做存储和计算,再在上面做一个中间软件层,然后做一个图的API,一年半载便可以出一个图数据库原型,基本能应付小量数据的处理。但是从头到尾没有为了图的存储、计算做优化和设计,只要数据量稍微大一点,性能就跟不上。另外,分布式数据库系统也开始成为主流,而老牌图数据库基本是单机版,只能针对一些特定的应用场景,市场并没有一款相对通用型的产品。数据库咨询公司 DB Engines 调研结果显示, 第一代图数据库的解决方案并不是为了支持现今企业所面对的海量数据和高增长率而设计的,而且它们无法提供图模型作为数据管理和分析的全部优势。因此它们无法为需要高性能深度链接分析应用程序的企业提供支持。

认清市场现状的许昱从一开始想清楚了产品开发路线图,“做数据库和做操作系统是一样的, 是个极其庞大的系统工程。一家刚起步的公司在资源很少的情况下完成一个完整的产品,必须一步步来,每一步都是基于上一步,既不用推翻, 又能迭代,逐渐达到最终目标,这也是决定公司成败最重要的一点。”TigerGraph 产品研发清晰的“三步走”就能很好地体现这一点:TigerGraph 最早期就是研发出基本的产品,从头开始从新研发自己的存储引擎、计算引擎,让用户看到产品的性能和优点;完成基本的产品原型后再进一步研发图的高级开发语言—GraphSQL,更加聚焦在业务逻辑和图的算法;最后开发可视化工具, 对图可以做可视化的探索、挖掘。

而且,许昱选择了一条开发周期长但是能保证产品高性能的路径,从起步阶段设计产品原型就追求“原生”和“并行”,许昱向《世界经理人》解释,“所谓'原生’,即基于图的理论、图的存储和图的计算,从底层开始开发的一套系统, 我们团队从头到尾重新写每一行代码,而且是用C++ 编程语言,专门开发了针对图数据库的底层架构。'并行’,即支持多台机器并行处理。”如今也成为他们在技术上的最大优势。他进一步指出, “分布式技术可以扩展高性能,支持万亿级的节点;而基于高级开发语言开发的工具,能带来更方便的操作界面;TigerGraph 通用型的工具设计, 则能不断适应各种行业。”

加速商业化

获得技术上的优势只是第一步,关键还是要推进并实现产品商业落地。2018 年开始,TigerGraph 开始致力于产品商业化。主要聚焦在两点:一是打出知名度,让潜在客户了解TigerGraph;二是获得潜在客户的认可并选择TigerGraph。

“我们当时毫无名气,虽然性能好,但是产品最早推出来的时候也没有开源。所以最重要的事情就是让大家知道我们。”许昱说,TigerGraph 开始在美国组建市场营销和销售团队。最关键的是,基于“原生”和“并行”的高性能优势,TigerGraph 做了大量全面又细致的基准测试(Benchmark Test)报告,将所有测试详情公布在开源及私有软件项目的托管平台GitHub 上,从测试数据、数据来源、测试标准等各种信息全在网上公开。

比如在一项针对性能基准的测试中, TigerGraph 的数据加载速度是Amazon Neptune20 倍以上;在存储上,相比Amazon Neptune, TigerGraph 图数据节约了8 倍以上的储存空间。在一度路径查询中,TigerGraph 快10 倍以上;而在两度路径查询中,TigerGraph 在两个数据集中都快58 倍以上……TigerGraph 在各项指标上均领先于亚马逊云服务提供的Neptune 图数据库。

正是这种专业的基准测试报告迅速让TigerGraph 在市场上打出了知名度,“在技术上获得市场的认可,并认识到TigerGraph 在技术的一些难以替代的独特优势。”许昱说,这一举措为TigerGraph 吸引了很多潜在客户,包括像著名的IT 研究与顾问咨询机构Gartner 都主动找上门并将他们一些潜在的客户推荐给TigerGraph。

当潜在客户了解并主动联系TigerGraph 后, TigerGraph 就会进一步做大量测试,跟其它竞标企业PK,获得潜在客户的进一步认可并最终做出选择。更关键的是,后续合作中,TigerGraph 的反馈速度与处理效率取得了客户的信任。

许昱表示,客户选择创业公司的产品一定是因为比传统老牌公司的要好,但是另一方面,创业公司的产品相对而言也比较新,出现问题的概率相对也比较大。所以创业公司一定要将解决客户的需求放在第一位,要特别重视客户的反馈。

以TigerGraph 为例,从获知客户的需求反馈、到内部验证通过、再到如何解决客户需求, TigerGraph 一般第二天就能给客户制定出一个解决方案。不像大公司有各种繁琐流程,一些客户需求可能要很长的周期才能得到响应,甚至需要额外付费才能获得解决。

许昱强调,从客户的角度来看,客户也要知道他能不能相信你,能不能跟着你一起成长,他有问题了,能不能依赖你,因为数据库对于客户公司内部来说也是一个很核心的产品。“举个最简单例子,如果客户买我们哪怕只是10 万美元的一个产品,他们肯定需要两三个人做业务开发,还需要人来运维,并获得业务部门批准和技术部门的运维认可,这可能就是一个一百万美元配套的投资。很多人买我们的数据库产品,本质上就是把他们公司的业务发展押在我们公司身上,比如帮助客户省钱、增加收入或者更好地服务于他们的客户,这是产品必须要达到的效果。”

目前TigerGraph 的产品主要提供四类典型应用。一是反欺诈和反洗钱,企业可以借助TigerGraph 系统在企业数据全景图上快速部署复杂有效的反欺诈和反洗钱业务,利用实时数据和实时深度链接分析应对金融犯罪。二是消费者智能,提供具有强大分析关系功能的应用;零售商能够通过实时功能允许快速合成和理解消费者的行为和活动,巧妙地聚类产品,并提出个性化的推荐。三是智能供应链,提供实时可见性和分析关键的供应链操作,包括订单管理,出货状态和其他物流。四是智能电网,TigerGraph 的分析能帮助能源公司监控和分析电力流动,检测瓶颈和针对电网性能问题报警,以及控制实时发电的电流量。此外,在智能供应链分析和IT、云资源优化等领域也得到应用。

在大数据技术迅速发展和企业数据处理复杂化的大背景下,图数据库已经成为当下成长最快的数据库分类,“图”也逐渐成为当今各行各业所采用的一种主流技术。“获得初步市场认可和接受的TigerGraph 现在最重要的核心就是加速商业化拓展。具体来说,一是上云,通过云服务来加速服务更多的客户,加速客户使用TigerGraph 产品的速度。二是加速产品的全球化,最早从美国、中国扩展到日本,现在已经扩展到德国、英国, 目前包括新西兰、新加坡、澳大利亚、法国等都有正在谈判中的客户。”许昱说。

本文记者/沐野

世界经理人媒体原创工作室成员。

(0)

相关推荐