从AI开放平台,到工业大生产基座:重新认识百度大脑5.0
根据麦卡锡早些时候的报告,未来AI技术90%的价值将发生在与各行业的结合,并且到2030年将创造超过中国与印度GDP总和的产业价值。毫无疑问,今天每一双眼睛都在紧盯着AI,好奇地审视着这一切到底会不会发生、如何发生。
显然,当众多观众、媒体与AI开发者一起来到百度AI开发者大会的时候,大家都希望看到一些关于产业智能化的新思考与新答案。毕竟百度是中国AI技术的名片,一个AI领域的新推动从百度开始,似乎已经被认为是合情合理的。
而百度也确实接住了这些期待。在百度AI开发者大会2019的主论坛上,百度CTO王海峰宣布百度大脑升级为5.0版本。而对这一次升级,王海峰将其表述为“百度大脑5.0全面升级成为软硬一体的AI大生产平台,希望能够深度赋能产业开发者,加速产业智能化进程”。
可能各位的问题已经随之而来,从AI开放平台到AI大生产平台,到底是什么样的变化支撑起了百度大脑的角色变化?让AI迈入产业世界,实现AI与工业大生产的融合,究竟需要达成哪些条件与基础?
AI技术与产业融合,从案例级别的“可以”,到千行和万业真实触发的“可以”。产业智能包含两个层面的含义,一是智能技术来到了产业化周期中,可以用更符合社会化大生产的方式向市场提供技术与解决方案支持;二是产业需求可以广泛应用AI技术,在其过程中成本可控、难度可接受。
换句话说,AI必须以工业的方式,进入工业世界。那么我们想要认识百度大脑5.0的全新定位与价值时,似乎要先回到更远一点的记忆中,回到工业大生产的肇始。
1769年,老约翰的工业之心
18世纪中叶的伦敦,举世闻名的大雾还没有来到它的峰值。
老约翰是一位老式织坊的主人,他正在筹划将数十年的积蓄拿出来,开一间已经在这座城市流行起来的纺织工厂。
但是严谨的老牌教育和学者作风,让这位未来的工厂主在投资之前,把开工厂这件事拆分成了很多个环节,从头开始审视自己的事业从小作坊迈入工业时代的所需前提。
经过大量走访和调查,老约翰把工厂能够成功的基础条件归纳成了三点:
1、技术达标:机器要能够满足生产差异化产品的需要,而不是论文与博览馆中的玩物。
2、充沛供给的能源和原料:煤炭和羊毛要能源源不断运送到自己的工厂里,否则工业生产很快将无以为继。
3、完整的产业链:技术工人、技术专利、半成品、市场客户,这些产业条件必须都能在伦敦附近找到,否则任何一个地方的缺失,都将让自己的工厂化为泡影。
在确认了泰晤士河沿岸可以满足这些需求后,老约翰开始了行动。当时的他并不知道自己参与了被后世称为改变人类历史的大事件。但这些朴素的认知,构成了一颗最基本的“工业之心”。
然后让我们将时间向后拨动250年,AI技术已经拥有这颗“工业之心”了吗?
能够触发想象力的技术体系
跳回21世纪的此时此刻,我们不难发现,一个技术是否能达成“工业化生产”的标准,一方面取决于其价值与通用性,一方面也取决于其本身发展是否能够满足老约翰得出的三个工业结论:技术达标、能源稳定,与产业链完善。
回到百度大脑5.0的升级,我们可以看到庞大的升级事项背后,其实正一一对应着工业化大生产这三大基本条件。
首先来看AI的技术标准问题。到今天,差不多每个人都能够说出几种AI技术,比如人脸识别、语音交互等等。但是对于复杂的工业场景来说,单一的语音或者机器视觉技术确实能够解决特定问题,但显然无法满足复杂产业情景与定制化形态的综合工业需求。
比如说在今天的AI开发者大会上,王海峰现场演示了与机器人茶博士的互动。在多个AI技术的加持下,机器人茶博士能够听、看、理解并执行复杂命令。其显然具备了复杂工业应用的可能,但却是今天一般企业难以独自研发和应用的。
或许我们可以将AI技术走入复杂工业场景这件事中,画上一条AI技术的产业应用标准线:标准线以下,企业只能应用到单一的AI技术,要在自身产业缝隙中寻找这种技术应用到何处;产业标准线以上,企业将获得大量前沿技术组成的技术条件,在此基础上发挥创造力甚至想象力。
这条标准线并不容易突破,去年百度大脑3.0中升级的多模态深度语义理解技术,已经让我们看到了技术突围的序曲。而在百度大脑5.0的技术升级中,众多超越我们对AI传统认知的技术纷至沓来。
百度大脑5.0,在语音、视觉、语言和知识这几大核心AI技术领域,发布6项技术突破:
语音方面,发布了流式多级截断注意力模型(SMLTA),使语音识别速度和识确度大幅提升,可解决中英文混合语音的识别;风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音。
而在视觉方面,百度大脑发布了全球首个基于视频流数据实时生成虚拟形象的“实时虚拟形象”技术方案,可以将一个人的形象和举动,实时流畅转换为另一个人的形像、话语、动作、表情等。
语言层面,百度大脑升级了基于知识图谱的视频语义理解能力。而知识增强的语义理解框架ERNIE已经累计学习10亿以上的知识,全面刷新了中英文双语自然语言处理任务效果。
这些每个都值得单独成文技术带领下,百度大脑形成了适应产业需求的全新形态:
1、技术种类足够丰富,AI开放能力达到210个,能满足各行业不同垂直需求。
2、技术深度达成突破,前沿技术能够重新激发行业想象力,与行业深度结合。
3、技术体系的模块化与融合能力,在百度大脑5.0版本中,已经有大量技术呈现出多种技术融合的特征。而多模态与模块融合,又是产业智能向深处发展的必要条件。
平心而论,虽然今天到处都在讨论AI,但AI技术在核心算法上的突破我们却听到的极少。扛着最大挑战向前走的百度大脑,正在用底层技术换取产业AI的核心生存空间。
牢靠的计算底座
我们知道,AI三要素是算力、算法和数据。如果说算法的突破是生存技术与生产工具,数据是行业生产原材料,那么算力就是AI走入工业化生产时的能源。
百度大脑在算力基础的进展,可以看作对AI产业化应用中,关于“工业能源”问题的解决方案。
在升级百度大脑5.0版本时,王海峰同时宣布百度大脑构建了一套端到端适配的AI计算系统,通过芯片连接系统和调度的协同设计和技术创新,为开发者提供百万TOPS的算力。
我们知道,今天的AI计算领域正在收获广泛的关注和研发投入。但从芯片层到开发、应用层之间的计算架构问题,是产业内普遍处于缺失状态的环节。因为计算架构不仅需要对芯片和底层算力的理解,同时需要对算法开发和模型训练具备深度理解,从而保证两侧之间的调度协同既不浪费算力,又能充沛保证AI加速需求。
这个层面的进化,可以说是百度大脑将自芯片到应用层所有环节都进行了创新补完。新的计算系统还可以紧密结合飞桨的训练架构,提供面向算法优化的集聚效率。
结合去年发布的自研云端全功能AI芯片“昆仑”,以及刚刚发布的专为远场语音交互打造的芯片“鸿鹄”,围绕百度大脑,已经形成了通用AI加速芯片、专用AI加速芯片、端到端AI计算系统组成的“算力铁三角”,稳固了AI走向产业化所需要的能源供给。
AI操作系统的通衢
回到工业革命时的产业标准,我们会发现还有一个问题是产业链搭建。或许大家会奇怪,百度大脑作为一个平台,如何满足产业链的需求?
答案在于飞桨。被定义为AI时代操作系统的飞桨,其本身价值即是产业链的集成。在底层工具之外,飞桨还将扮演产业链中枢的角色,为开发者和产业应用者提供产业向工具、定制化服务,以及产业生态和新的市场触达可能。
某种程度上来说,飞桨所处的AI操作系统层,恰好是处在算力层与应用层的中间地带。这个层面的平台,既保证了高可用性和生态活跃,同时也具备模块化、标准化、自动化的产业基础平台性质。所以飞桨很可能成为产业AI时代的中枢,保证技术纵向与产业横向的完整和高度开放。
飞桨的关键在于“通”,这件事在不久前的首届百度深度学习开发者峰会上已经得到了展示,飞桨的全面图景容纳了产业智能化的种种需求。不同领域、不同技术基础、不同任务环节的AI开发者都可以在其中获取帮助。
而在百度大脑5.0升级中,百度大脑与华为麒麟又联合宣布了一个重磅的“通”。王海峰与华为消费者BG软件总裁王成录博士联合宣布,百度飞桨将与华为麒麟芯片进行深度对接,用全球领先的端侧AI芯片和中国自己的“AI时代操作系统”为端侧AI提供最强劲算力、打造最好的深度学习运行效率。
这条新的通衢,具有两方面的产业意义。一来百度飞桨生态中的深度学习开发者,将可能获得通向移动AI时代与产业纪元的船票,触发全新的市场机遇;二来华为HiAI开发生态将获得更高效的开发效率与开发深度,真正借助百度的深度学习技术积累,将移动AI推向更广泛的发展空间。
AI操作系统+端侧AI芯片,这个组合今天确实仅在中国才有。中国的产业智能时代,就孕育在这些技术差异化到产业差异化的机遇与变革里。
2019年,百度大脑的产业AI集结号
蒸汽机和煤炭代表的工业革命250年后,人类经历了电气革命、信息革命,终于抵达了智能革命的门前。
但是智能革命的大门怎么敲,却是一个正在探索进行时的问题。而在AI走入产业智能化阶段,有一个核心问题其实很少被大众关注:量变。
我们都知道,AI在理论和逻辑上可以与产业结合,顺着数据与逻辑推理,产业智能可以带来难以想象的经济价值。然而抛开量变谈事件发生的必然性,基本等于耍流氓。如果AI算力始终不够、AI算法始终无法满足复杂工业需求、AI产业在实践中总是缺乏产业对接效率,最终的智能革命会发生吗?
显然,第四次工业革命不会孕育自空想。只有一点点技术突破积累,产业基础逐渐完善,生态真正建立,最终恢弘的产业AI时代才能拉开大幕。
王海峰认为,自2010年左右百度开始积累AI技术,百度大脑其实就已经进入了0.0时代。百度大脑近十年一步步地走来,就是那个中国AI酝酿量变的过程。
百度大脑5.0的升级发布,对于AI行内人来看有点像特效满满的好莱坞大片。每一项技术升级都足够震撼,完全值得单独拿出来举办一场发布会。但是百度大脑一次性拿出来了“一群”带着足够震颤感的创新升级。这或许能在一个侧面表明,量变到质变的时刻确实临近了。
回顾过去,我们会发现百度大脑的每次升级,都着重强调技术怎样,而不是目标怎样。直到5.0,各层级的突破叠加后,百度大脑开始表露清晰的目标——各环节达标,各条件被满足之后,接下来百度大脑将作为AI时代的工业化大生产平台。
至5.0时代,百度大脑的特质已经呈现为一个“三全平台”:
1、全周期软硬件一体化平台:从芯片、开发框架、应用层,到硬件系统的全面贯穿,满足工业级应用和大规模部署所需的并发性、兼容性与稳定性。
2、全应用流程调用:从深度学习基础技术,到通用AI能力、应用技术方案,再到定制化模型,以及最终的部署与集成,一个平台打通AI产业应用的全部流程,满足产业落地需求。
3、全AI底层技术容纳与融合:在语音、视觉、自然语言处理、知识图谱领域具有广泛多元的技术部署与技术领先性,满足不同行业、不同企业,不同应用周期的需求。
“三全”的百度大脑5.0,接下来的任务是适应更多行业的需求,让更多企业加入塑造案例,搭建产业链,并且验证产业智能化的实际价值模型、各AI技术的不同行业适配度、总结产业智能化方法论,最终证明证明everyone can AI。
现代智人有七万年的历史,而人类6000年前才进入青铜时代,250年前进入了工业时代。某种意义上来说,人类生产文明的发展,就是一场不断超越自身纪录的加速跑。
两个半世纪之后,第四次工业革命也好,首次智能革命也罢,我们能目测到一场改变确实正在发生。既然工业革命的步伐始终都在加快,那么为什么不能发生在今天,发生在中国,发生在百度大脑生态里,发生在你我身边?
恰逢风云,堪称快哉。