离开阿里后,这群码农竟把“生命计算”搬到了云上

2014年人类全基因组测序成本降低至1000美元,全球基因检测领域迎来了第一个春天,中国的基因检测市场更是爆炸式增长。2017年,Illumina再次将全基因组测序成本降低到800美元。测序成本降低的同时,全世界的基因组数据也在以超摩尔比速度增加。基因数据的计算与解读一直都是基因检测的重要环节。在数据激增的情况下,如何更快速,更准确的进行数据分析和解读,将是基因检测领域下一个命题。借此契机,动脉网将推出“基因&数据”系列报道,详情可持续关注。

GeneDock(聚道科技)是一家基因领域的数据技术公司,运用组学数据仓库、科研临床协作系统、生信计算环境、组学数据挖掘等组学数据技术帮助客户构建组学数据管理平台,面向基因领域提供基因数据的传输、存储、分析、计算、协作和应用等一体化解决方案。同时提供开放接口和开发环境,让用户能够方便的来管理和操作数据,并与用户自有系统对接。

公司拥有完善的研发软硬件环境,其公有云平台对接多个计算域上千个节点的计算资源,同时还提供专用私有云解决方案。公司目前服务对象包括国家疾控中心、科研院所、三甲医院、医药研发企业和基因检测公司等。

在数据处理环节发挥协同作用

2014年,李厦戎还在阿里巴巴任友盟首席数据科学家,通过朋友了解到了基因测序行业。快速发展的测序技术和正在兴起的基因检测应用,都让他非常好奇。本就是数据科学出身,李厦戎明显感受到了正在逐渐渗透到各个领域的大数据技术在基因领域可以发挥巨大的作用,尤其是基因测序数据的生产、应用和挖掘模式都已经非常清晰,数据闭环正在构成。他告诉动脉网记者:“基因组数据处理会涉及到多个机构和不同专家,发展到一定程度必然会出现协作需求。我相信基因组数据分析和应用一定有巨大的市场潜力。”那时候,李厦戎萌生了创业的想法。

通过测序获得基因组数据后,还需要经历质控、分析、注释和解读等步骤,才能获得终端用户所需的报告和知识。每个样品测序后所产生的数据规模可能高达数百GB,为产业链上下游之间的数据传输带来困难。另一方面,之前行业普遍使用本地化小型集群进行生信数据分析,而随着测序成本下降,多样本的深度分析成为了新的趋势,如何在提高生信分析效率的同时控制硬件投入成本也成为行业共同关注的问题。

国外基因市场起步较早,基因组学数据分析也走在前面。目前,国外已经有许多成熟的生物信息云平台,如Seven Bridges Genomics、DNAnexus、NextCODE(被药明康德收购)、Illumina的BaseSpace等,其中Seven Bridges Genomics更是拿下了2014年美国国家癌症中心580万美元的癌症基因组云计算项目。而国内市场当时尚没有一家类似模式的基因数据云平台供应商。凭着多年的大数据领域工作经验,以及对国内外的相关市场研究,李厦戎判断,云平台将是基因数据处理的未来趋势。他联系到了当时阿里云的大数据产品经理王乐珩,还寻找到了几位生物信息领域的小伙伴,一起在居民楼里开始GeneDock创业之旅。

模式与产品,创业初期的纠结

一开始,算上创始人和早期的核心成员,团队也就4、5个人。公司还没有一个客户,完全是按照自己对行业的了解和这个领域已有的一些经验来进行产品设计。李厦戎回忆:“当时我们每天都关在屋子里写代码,也不知道用户的需求是什么,有种闭门造车的感觉。”

即便工作环境算不上高大上,整个团队的创业热情依然很高。目标很明确:要做基因组的云计算平台。当时面对的最重要问题就是怎么做,做成什么样子。没有产品很难找到客户,而没有客户又无法了解客户需求,也就无法知道产品在市场上是否有价值。此外,国内外的国情存在差异,国外成熟模式是否可以套用仍然存疑。另外产品除了满足基因组数据分析的需要外还需要做别的吗?这些事李厦戎每天都在纠结。

2014年9月,李厦戎在一次会议上结识了艾吉泰康创始人杭兴宜博士。两人相谈甚欢,对生物信息的云趋势有着相似的理解和认识,艾吉泰康也成为了GeneDock的天使客户。“通过服务艾吉泰康,我们看到了更多的行业需求。能遇到这样的天使客户,我们也蛮幸运的。”随着产品的逐渐完善,中国疾控中心、西南医院、泛生子……GeneDock逐渐接触到了不同类型的客户和场景。一面是越来越完整的用户场景描绘,一面是在接触市场过程中不断总结经验,提高自己,GeneDock开始收获更多的成果和认可。2015年下半年,GeneDock基于公有云的生物信息云平台正式上线。同时,公司还完成了由经纬中国领投的1500万人民币A轮融资。

“但光有一个产品是不够的,我们要进一步了解和挖掘客户需求和市场痛点。”这位IT出身的理工男并没有局限在产品和技术上。当团队和产品都有了雏形,李厦戎又开始了商业模式的探索。在接下来的半年里,他带领团队仔细了解了国内大大小小的基因公司、科研和临床机构的现状,力求沿着用户的真实需求继续深入研发,扩大用户规模。

不满足于某个点,提供更全面服务

2016年,GeneDock的商业模式慢慢清晰。基于强大的基因数据管理和分析技术,GeneDock面向基因检测行业提供组学数据仓库、科研临床协作系统、生信分析计算平台、基因组数据挖掘等服务。通过使用上述服务,GeneDock的客户可以用更低的成本、更高的效率、更自动化的方式完成自己的业务,并且可以为自己搭建一个安全稳定业务环境。随着后续数据量和用户数的增长,客户还可以借助GeneDock的这些服务实现组学数据和表型数据的积累和进一步挖掘,使自己的数据可以创造更大的价值。

此外,GeneDock也可根据不同类型用户的实际需求,为他们量身设计包括公有云、私有云或混合云在内的组学数据管理协作解决方案,帮助用户解决海量基因组数据的安全管理、高效协作等问题。

对GeneDock而言,公司进行产品开发时不能仅仅着眼于行业市场在某个点上的需求,而是应该通过不同的产品模块和服务形成一个完整的解决方案。为了满足客户的需求,帮助客户达成核心诉求,GeneDock始终没有停下产品迭代的步伐。比如完善的企业级账号和资源权限体系,可以帮助企业更好地完成组织管理和数据管理。比如表型和基因型数据仓库,可以帮助医疗和科研机构夯实大数据挖掘应用的基础。“不只是单一的满足用户的某个具体需求,而是结合客户的业务场景,甚至考虑到对方长期的发展诉求结合行业的趋势,然后寻找更全面的解决方案,更好地服务客户。”李厦戎告诉动脉网。

分析技术的进步以及测序成本的下降,使得基因测序日益趋向大众化。这个行业变化的速度越来越快,基因检测已经开始走向临床应用,而云计算和区块链等先进的IT技术也起到了日渐重要的作用。尽管这个行业还有一些自身属性的特点,例如数据的安全和隐私要求极高等,但整个行业借助IT技术快速发力和成长的趋势已经很明显了。GeneDock将在这样的趋势背景下,充分发挥自身的技术优势,成为基因检测行业的可靠的基因数据技术伙伴。

写在最后

采访末尾,记者问李厦戎GeneDock的里程碑事件有哪些。李厦戎稍微停顿了一秒:“每个客户都是我们的里程碑。”这样的回答让记者颇感意外。随后,他向记者解释:“每个客户其实都是我们成长中的重要伙伴,给我们提了很多产品建议,所以每个客户在GeneDock产品和服务迭代过程中都帮助我们提升很大。”GeneDock的合作伙伴有企业,有政府机构,还有医疗机构。不同领域的客户所面向的终端人群是不同的,需求自然也就不一样。也许正是这样多元化的客户群体组成,才让GeneDock对这个领域的真实需求有了更加全面的认识,并将这样的全面认识体现在产品和服务的设计开发上,用组学数据技术帮助合作伙伴成功。

文|周梦亚

微信|rencontre_my

添加时请注明:姓名-公司-职位。

后台发送关键词即可获得相关好文!

网站、公众号等转载请联系授权

tg@vcbeat.net

「推荐阅读」

互联网医疗创业三年,为什么我们越来越惶恐?

银川互联网医院全套政策解读,申请互联网医院、在线多点执业必看【附文件下载】

蛋壳周报0319:华大基因再次递交招股书,互联网医院在银川迎来里程碑事件

动脉网所刊载内容之知识产权为动脉网及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

(0)

相关推荐