#榜样的力量#荣之联基因数据分析一体化解决方案丨数据猿新冠战“疫”公益策划
大数据产业创新服务媒体
——聚焦数据 · 改变商业
总书记2月14日下午主持召开中央全面深化改革委员会第十二次会议并发表重要讲话。他强调,确保人民群众生命安全和身体健康,是我们党治国理政的一项重大任务。
总书记强调,要改革完善重大疫情防控救治体系,健全重大疫情应急响应机制,建立集中统一高效的领导指挥体系,做到指令清晰、系统有序、条块畅达、执行有力,精准解决疫情第一线问题。要鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。
项目起止时间:2020年01月26日至今
应用场景
作为国内领先的云计算和大数据服务提供商,荣之联在生命科学领域深耕10年,坚持BT和IT的融合发展,提供基因数据分析一体化解决方案,囊括公有云(UEC BioCloud)、BioStack私有云(面向生物医学大数据的存(分布式存储系统)、管(数据管理系统)、算(超级计算系统)、用(集成生信分析应用流程)全栈式平台)、生物云一体机(可提供临床辅诊分析、科研检测、科研数据分析等),并能提供total solution整体解决方案。目前,荣之联基因数据分析一体化解决方案已成功服务于30多家基因测序领域的客户。
荣之联基因数据一体化解决方案提供软硬件一体的可视化生信分析平台,支持用户本地化部署、架设在荣联生物云端部署两种方式。可完全满足生物信息分析中对于速度、规模和智能化的需求,同时可以整合大量生物信息学流程和软件,集成肿瘤、遗传病、微生物、新冠病毒、动植物等基因组数据分析流程并产出结果报告。同时全中文图形化的操作界面,让基因数据的研究变得更加简单、高效。此外,配备的硬件资源使计算和存储无压力进行。
面临挑战
研究取得突破和发展是依靠对科技资源和数据的全面掌握与深入挖掘分析,其中新一代测序技术(Next generation sequencing,NGS)是生物医疗、公共卫生领域常用的重要手段之一,运用NGS技术获取原始基因数据,然后进行标准基因数据分析、深度基因数据解析形成报告,辅助科研人员的工作。由于成本、人工的限制,目前科研院所采用的方式一是委托第三方检测公司进行测序分析、返回报告的形式;二是自建测序平台进行测序,但因其数据分析需要生物信息专业人员进行,因此还需要第三方公司服务。不仅如此,随着检测数目的增加带来的数据量的增加,也为数据的存储、计算带来压力。因此,如何快速、准确地处理庞大的数据是目前面临的挑战。
疫情来临之际,科研人员面临的挑战急需解决。一方面需要硬件环境做好支撑,另一方面需要专业的病毒基因组分析流程支撑科研人员的研究工作。基因数据一体化解决方案支持用户本地化部署、架设在荣联生物云端部署两种方式。
在本次抗击疫情过程中,荣之联的行业技术能力再次得到了奋斗在疫情最前沿的疾控科研机构的认可。在最短的时间内,帮助疾控科研单位完成计算、存储环境安装部署及测序设备的联调工作,保证大规模并行样本分析、数据保存和管理,全面助力病毒测序工作的顺利完成。同时,协助科研机构客户在UEC BioCloud平台基础上,迅速搭建病毒基因组进化关系的分析流程,以实现基于新型冠状病毒2019-nCov的全基因信息,对病毒的进化关系进行分析,为做好新冠病毒研究提供强有力的平台支撑。
实施过程
为了保障数据精准,荣之联投入大量资金进行软硬件技术设施的更新。
荣之联始终坚持运用大数据、人工智能、云计算等数字技术,结合多年的行业实践经验,在生命科学领域提供专业产品、解决方案以及数字化服务。荣之联与山东大数据研究院达成了战略合作,全面提升在生物大数据分析平台基础设施建设、平台关键技术研发以及面向微生物组、营养组、人工智能等行业应用上的技术与经验。
科技战“疫”,荣之联致力以基因科技的力量助力国家疫情防控,保障全民健康。
一、荣之联基因数据一体化解决方案 ——生物云一体机
2020年1月26日,荣之联收到疾控科研机构的支援请求,由于测序通量增加,急需计算和存储资源。 鉴于新型冠状病毒肺炎疫情发展,防控疫情是每个人每个企业的责任。荣之联董事长王东辉亲自牵头,迅速选派在京技术人员及时抵达公司调试计算、存储资源,一切以满足疫情的需求为前提全力调配。于当晚深夜完成计算、存储环境安装部署及测序设备的联调工作,保证大规模并行样本分析、数据保存和管理,维护设备的稳定运行并提供技术支撑,全面助力病毒测序工作的顺利完成。
通过评估疾控科研机构的实际需求,最终选择生物云一体机产品,生物云一体机是基于二代、三代测序技术的数据分析及解读综合解决方案。生物云一体机配备安装了最先进的生物信息分析软件及系统软件工具,通过使用生物云一体机,用户可以完成基因数据标准分析、个性化分析、变异信息解读等。
生物云一体机产品形态:
生物云一体机产品核心功能模块
·生物信息分析计算引擎(Helicube Engine)
·高性能组学分析算法软件
·可视化基因组浏览器(MGB)
生物信息分析计算引擎
生物信息分析计算引擎(Helicube Engine)是系统软件,用于管理基因数据和分析流程,管理用户和工作空间,调度分析流程的执行以及编排硬件。用户可自定义不同角色在高通量测序数据分析环境中执行测序分析工作流程:
·支持上传程序或网络连接测序仪,工作空间浏览器和自动作业安排等工具来管理数据,针对不同的数据集运行分析流程;
·分析流程编辑器支持创建分析流程,使用访问控制机制管理不同版本分析流程对不同用户的可用性;
·智能调度和作业并行机制支持批量自定义生信流程编排和数据再挖掘,统计分析。
生物信息分析计算引擎(Helicube Engine)由5个核心组件构成:
·调度程序和工作并行程序:调度程序将作业分成多个子作业,并通过确保最佳的执行顺序来对这些子作业进行安排,随后工作程序会执行这些子作业;
·文件服务器:文件服务器作为用于管理中央存储器的存储管理器,具有多种功能来处理存储器中的文件,此外还可以上传和下载数据;
·分析流程编辑器:可视化创建生物信息分析流程;
·网络和命令行界面:用户或组件与系统进行交互的API。使用Python编写的RESTful和CLI是两个可用的选择;
·用户界面:B/S架构,用户通过浏览器登录并试用系统,支持多种功能,如用户身份验证、文件管理和分析流程编辑器。
高性能组学分析算法软件
高速基因组变异检测软件模块, BWA/GATK/Mutect/Mutect2金标准数学模型,提供从原始基因组测序数据到变异结果的一站式数据分析,实现最高水平特异性和灵敏度。
可视化基因组浏览器(MGB)
可视化基因组浏览器(MGB)是超快速多基因组变异可视化查看器,占用内存低,加载速度达到秒级(包含VCF,BAM,ASM,BED)。用于对基因数据变异注释结果进行可视化处理,支持加载变异在数据库中记录信息。
生物云一体机产品优势
·节省时间、提高效率:生物云一体机的检测分析速度领先行业水平。从输入原始数据到变异检出,单台一体机WGS数据3小时内即可完成;WES数据可在单服务器工作情况下,10分钟内即可完成;
·开箱即用、节约人力成本:生物云一体机能为客户提供开箱即用高通量测序数据分析软硬件一体化解决方案。B/S架构全操作流程可通过网页界面使用,可视化水平高,不要求用户具有UNIX/Linux系统操作、编程等知识背景,降低人力成本,新用户学习使用也十分便捷;
·准确、灵敏:生物云一体机准确、灵活。特别为临床高深度测序数据优化,Precision FDA测试结果,特异性>99.33%,敏感度>99.36%;
·动态扩展:生物云一体机具备可扩展性和兼容性,可以支持多台一体机组成小型分析集群,支持外接存储系统,客户可自主部署特有分析流程,胜任科研分析数据挖掘。
二、荣之联基因数据一体化解决方案——可视化生信云平台
为适应大规模批量病毒基因组的分析计算需求,科研机构研发的可视化分析应用无法满足大规模并发计算的分析需求,通过与客户深度沟通发现,客户曾多次进行平台建设,众多的计算和存储资源无法进行统一的管理,希望能对以往计算存储资源进行统一管理,并将原生信分析流程进行标准化、可视化封装。
针对客户所面临的生物信息分析对于速度、规模和智能化的需求,荣之联在其原有计算存储资源上进行调整、优化后部署一套可视化生信云平台。最终方案是通过荣之联云平台做对接,在生物云平台上开发、迁移、优化、整合大量生物信息学流程和软件、部署病毒基因组进化关系的分析流程,并选派研发小组随时待命以快速响应客户需求。方案内容包括云管理平台UEC Biocloud部署、云平台流程定制开发及生信工具迁移。是一款零代码网页式生信分析平台。
平台功能特点
·降低运维成本:无需自建机房的大量资金投入和管理成本,免去专业的IT运维团队。客户可专注于自身科学问题的研究;
·简单易用:一键开启作业分析,支持用户自己对分析流程的编辑,取消繁琐的命令行模式,零代码基础要求;
·自动生成结题报告:一键生成结题报告,报告图片可用于发文章 报告模板可定制;
·项目可分享协作:以项目为管理单元,项目创建者可以加入项目成员并可控制权限,同一个项目内可以共享文件、流程和分析结果,实现多人团队协作;
·数据信息全面安全保障:多层次安全防护:数据加密传输,采用业界通用标准的安全传输协议;云端加密存储,AES-256加密算法;严格的用户权限控制、多租户数据严格隔离,完善的审计日志;符合HIPAA法案等多种监管条例。数据多重备份,保障数据的完整性;
·资源无限扩展:计算资源弹性拓展,分析过程中需求用到多少资源,平台能快速调配计算资源,并采用最优配置。海量云存储空间,存储时长无限制,容量弹性扩展。
应用效果
荣之联基因数据分析一体化解决方案一步到位解决疾控科研机构和科研单位面临的计算、存储、生信分析问题。
·生物云一体机可与测序仪的自动化对接,解决上游测序到中游分析的衔接过程中以硬盘的方式人工进行数据拷贝的问题,节约人力成本,提高数据传输效率。
·生物云一体机作为高性能轻量级软硬件一体化产品,从用户角度出发,解决疾控科研机构在生信分析过程中的实际问题,保证用户能够真正把测序和分析打通,使用户在本地就可以实现从测序样品上机直至数据下机,得到测序结果、分析报告等一站式服务。
·可视化生信云平台项目实施完毕后,能够充分利用计算和存储资源;内嵌的计算分析软件无需担忧兼容性和版本冲突;摆脱繁琐的命令行管理方式,通过全中文图形化界面,让生物数据的研究变得更加简单、高效;此外,当可视化生信云平台在科研单位本地的计算资源不足时,可以弹性在荣之联IDC的可视化云平台上完成生物信息学的分析。
关于荣之联
北京荣之联科技股份有限公司成立于2001年3月,是深圳证券交易所的上市公司,股票简称“荣之联”,股票代码002642.sz,注册资金6.62亿元人民币。总部在北京,全国拥有30余家分支机构,拥有员工1000余人。
公司坚持自主创新,坚持创新与应用相结合,取得授权发明专利32件、软件著作权234件。荣之联是国家高新技术企业,是首批通过ITSS符合性评估的软件企业之一,并取得了CMMI3级认证。具有信息系统集成一级资质、信息安全服务资质(安全工程类一级)等信息技术服务行业相关资质和能力。
作为国内领先的企业云计算和大数据服务提供商,荣之联致力帮助客户实现核心业务的全面数字化转型,并以独创的数据平台和行业解决方案为行业客户赋能,支持其对各类数据资产的收集整理、价值挖掘和应用创新。
荣之联不断将云计算、大数据、人工智能等新兴技术与行业应用相结合,为客户提供优秀的产品和解决方案。在云计算领域,公司帮助客户整合已有的IT资产,实现数据中心和IT基础设施的集约化管理,引导企业级IT系统向私有云和混合云演进的同时提供数据中心服务,私有云及混合云建设服务,专有云建设及服务等;在物联网领域,公司提供数据采集和接入产品,通过边缘计算和物联网平台,支持车联网、智能制造、农业物联网、智慧能源领域的建设和服务;在数据服务领域,公司在数据存储、数据可视化、数据应用方面积累了丰富的经验,为企业数据的采集、计算、存储、管理、应用提供数据生命周期的技术、产品及服务,同时围绕特定行业提供数据业务的解决方案;在生命科学领域,为基因研究和精准医疗提供量身定制的临床诊断分析系统、基因数据平台和生物云计算服务,实现医疗生物与信息技术的深度融合和创新应用。
多年来,荣之联建立了覆盖全国的销售和服务网络,深耕金融、运营商、生物医疗、政府公用、能源制造五大行业,并与业界各类知名IT厂商建立和保持良好的合作关系,为客户提供全面的解决方案和优质高效的服务。