重定义数据基础设施 华为AI战略再下一城

华为常务董事、ICT战略与Marketing总裁汪涛

文 | 懂懂   编辑 | 秦言

来源:懂懂笔记

作为世界上最重要的数学家之一,高斯有着“数学王子”的美誉,以他名字“高斯”命名的成果就达110个,属数学家中之最;为致敬高斯,沿袭“数学王子”为人类社会发展和进步所做的贡献,华为将自己所研发的全球首款人工智能原生(AI-Native)数据库命名为“GaussDB”。

这无疑是数据库领域的一次大事件。众所周知,数据库技术的发展和应用由来已久,但在过去许多年间,数据库领域并没有出现太多的变化,直到云计算、大数据、人工智能等新技术的兴起。

如今,云原生(Cloud-Native)数据库正在逐渐取代传统数据库,包括Amazon Aurora、阿里云POLARDB等在内的Cloud-Native数据库正在成为企业的新选择;如今,华为则在Cloud-Native数据库的基础上再进一步,直接将数据库带入AI-Native时代。

数据库作为与中间件和操作系统相并列的三大基础软件之一,一直都是中国企业的软肋;如今华为携经过九年研发的GaussDB数据库,征战新的数据库“无人区”,不仅是华为在数据库产品上的突破,也是公司继去年发布AI战略和全栈全场景AI解决方案后,在数据基础设施层面的又一全新突破。

1

闯入数据库“无人区”

近年来,人们已经对数据的爆炸式增长有目共睹,不同的业界分析机构所给出的预测也充分印证了这一事实。比如,华为发布的《全球产业展望GIV 2025》报告就给出预测:全球数据量将从2018年的32.5ZB快速增长到2025年的180ZB。

与数据快速增长相伴而生的数字经济规模占比也在不断上升,日前刚刚发布的《数字中国建设发展报告(2018年)》显示,2018年我国数字经济规模达到31.3万亿元,占GDP比重达34.8%,超过三分之一。

但数据库作为数字经济发展必不可少的基础软件之一,在过去许多年都没有出现颠覆性的发展,包括甲骨文、微软、IBM等在内的传统IT巨头依然垄断者数据库市场。不过,在物联网、VR等新应用场景下,包括图片、音视频等在内的非结构化数据快速增长,给传统数据库也带来的全新挑战。

来自权威机构Gartner的报告也显示,随着云和分布式架构逐渐普及,数据库在私有云、公有云等企业技术架构平台中将发挥更为重要的作用;而大企业级市场需求持续强劲,对数据库提出众多新需求和新挑战。因此,亚马逊AWS、谷歌、阿里云等都纷纷瞄准Cloud-Native数据库领域,试图颠覆传统数据库市场。

可以说,开源数据库、Cloud-Native数据库等新兴数据库产品的快速增长,正在占据更多的市场份额;传统数据库市场正在前所未有的市场变局。这无疑也给中国数据库技术的发展和应用带来了新机遇。

在过去很多年中,由于中国数据库企业起步较晚、自研能力弱、功能和服务能力有限,中国数据库企业的产品主要应用于中国市场,在国外的市场份额很低。因此对于华为来说,打造数据库产品这一基础软件,而且直接瞄准AI-Native这一数据库产品研发的“无人区”,既是出于自身发展战略的考虑,也在一定程度上代表着中国数据库产品迈向全球市场。

华为常务董事、ICT战略与Marketing总裁汪涛表示,早在2011年,华为就已经启动了AI-Native数据库GaussDB的研发,只不过过去华为是将其作为公司产品的一个嵌入式组件,而如今GaussDB作为一个完整产品的发布,是希望让业界认识到,华为在这个领域的创新以及给行业数字化、智能化转型所做出的贡献。

2

重定义数据基础设施

众所周知,人工智能的迅速发展离不开三大要素的支撑:算法、算力和数据。在数据层面,可不是每天搜集和存储海量数据那么简单,要知道,当前只有不到2%的企业数据被保存,而其中得到分析利用的不足10%,数据价值远没有得到充分释放。

究其原因,主要体现以下三个方面:1、业务和数据的日趋多样性,使得传统的单一计算架构越来越无法满足多场景、多数据类型的处理需求;2、过去数十年间,随着企业应用的快速发展,IT系统已经形成了一个又一个信息孤岛,数据无法共享、管理和扩展复杂,存储效率问题凸显;3、在智能化时代,传统数据分析平台已经无法适配AI引擎,数据价值难以得到充分挖掘。

在汪涛看来,数据基础设施已经成为各行各业加速智能化进程的必由之路,企业必须要建设更快、更智能的数据基础设施。为此,华为将围绕计算、存储和数据处理三大领域重定义数据基础设施,助力各行业加速迈向智能时代。

华为GaussDB的发布,正是公司瞄准数据处理领域的一个重大举措。华为首席数据库科学家李国良表示,作为全球首款AI-Native数据库,华为GaussDB有两大革命性突破:

第一,首次将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈。其中,基于深度强化学习的自调优算法,调优性能比业界提升60%以上;

第二,通过异构计算创新框架充分发挥X86、ARM、GPU、NPU多种算力优势,在权威标准测试集TPC-DS上,性能比业界提升50%,排名第一。此外,GaussDB还支持本地部署、私有云、公有云等多种场景。

针对智能时代对存储系统性能、规模、可管理性等更高要求,华为在存储领域还发布了新一代智能分布式存储FusionStorage 8.0,并实现了三大创新突破:第一,分布式存储性能业界第一,并首次让分布式存储也可以承载企业关键应用;第二,首次实现一套存储同时支持块、文件、对象、HDFS协议,一套存储可支撑一个数据中心;第三,率先将人工智能技术融入存储全生命周期管理,从资源规划、业务发放、系统调优、风险预测、故障定位等方面实现智能运维管理。

而在计算层面,华为也在持续推动计算架构从以x86+GPU为主的单一计算架构到以x86+GPU+ARM64+NPU为主的异构计算架构快速发展。比如,基于x86架构,华为引入AI管理和智能加速能力,率先推出了智能服务器FusionServer Pro;基于ARM64打造了业界性能最强的泰山服务器;基于Ascend芯片的Atlas智能计算,实现了业界首个端边云协同的人工智能平台。

可以说,通过以上种种举措,华为从计算、存储和数据处理三个方面重定义了数据基础设施:引领多样性计算,让算力更充裕更经济;重定义存储架构,大幅提升效率,引领存储智能化;重定义数据处理平台,让分析更智能,加速实现数据价值。

3

释放智能时代数据价值

你或许不会想到,现在炙手可热的自动驾驶技术实际上是由海量数据的高效处理来支撑的。以L5级别的自动驾驶为例,每辆车每天产生的数据就有64TB,而从自动驾驶汽车开发到量产需要积累100亿公里以上的自动驾驶里程经验,这一过程中所产生的数据将超50EB。

类似的场景在金融行业也在上演,在金融安全领域,金融风控的要求处理时间小于100毫秒,而传统金融风控平台根本无法实现这样的业务需求。以银行信用卡的盗刷为例,如果两笔交易在相隔千里的两地几乎同时进行,借助数据的智能实时处理,金融风控系统可以迅速做出反应,及时终止疑似盗刷的交易。

如今,在自动驾驶领域,华为云自动驾驶云服务Octopus覆盖提供3万个虚拟场景仿真测试,让模型训练速度提升80%,开发周期从“月”缩短到“周”;而在金融风控领域,基于大数据、内存计算和人工智能技术的华为金融实时风控解决方案能实现千万维度数据量,30毫秒内完成风控计算。2018年,这套系统帮助招行减少交易损失5000千多万美元,降低风险发生率83%。

类似的应用场景已经在各行各业展开,截止目前,华为GaussDB数据库和FusionInsight大数据解决方案已经应用于全球60个国家及地区,服务于1500多个客户,拥有500多家商业合作伙伴,并广泛应用于金融、运营商、政府、能源、医疗、制造、交通等多个行业。华为云已经发布了13款数据库服务,为行业客户提供云上数据仓库服务。华为FusionStorage已服务超过1500家客户,在IDC 2018年中国区软件定义存储市场份额报告中,华为稳居第一。

数据价值在各行各业的释放同样离不开合作伙伴的参与,因此华为在打造GaussDB数据库、FusionInsight大数据解决方案的同时,也非常注重与不同行业、组织的密切合作。

华为IT产品线副总裁、Cloud&AI CTO Office首席架构师黄瑾对此表示,在标准层面,华为正在积极推动基于Open SDS(开放软件定义存储)的标准,促进存储系统和各种其他的应用系统之间的互通;在平台和工具层面,华为将为开发者和合作伙伴提供更加易用的工具,让他们能够基于华为的平台进行解决方案的开发;在行业应用层面,华为也将和各行各业的软件开发合作伙伴一起联合向客户提供更有商业价值的解决方案。

如今,各行各业在关注数据价值释放的同时,对数据安全的保护也非常关注,面对这一行业共同的挑战,华为也在保证用户数据安全上采取了一系列措施。汪涛强调,华为会严格尊重数据的所有权,不从用户数据进行变现,不拥有用户的数据;而且在不同的国家,华为也会严格遵守当地关于数据管理的法律法规要求。与此同时,华为也将从技术层面为用户提供更先进的数据保护技术,实现对客户、对行业、对政府的承诺。

“华为是创造者,不是破坏者。”掷地有声。

【结束语】

在人工智能等一系列新技术的推动下,数据库市场正在迎来前所未有的剧变。从传统的关系型数据库到开源数据库、Cloud-Native数据库,再到AI-Native数据库,数据库正在成为智能时代基础设施中的关键一环。对于华为来说,在打造全栈全场景AI解决方案的过程中,数据库这一块短板迟早需要补上;如今GaussDB数据库产品的横空出世,通过与存储、计算等相关产品的融合,所带来的不仅是更加完善的AI解决方案,甚至将是整个数据库市场的变革。

    推 荐 阅 读    
(0)

相关推荐