最强AI算力哪里来?三个时代的阿里叠影

又是一年云栖时。

阿里的云栖大会,堪称科技众的年度狂欢之一。而今年似乎格外特殊,阿里云十岁生日,阿里巴巴集团20周年,似乎都让今年的云栖有点不同。而从技术从业者的角度来看,或许另一个不同更加引人注目:被广泛认知为互联网公司的阿里,今年云栖上唱主角的居然是一款AI芯片。

9月25日,达摩院院长张建锋现发布了“全球最强的AI芯片”——含光800。在AI行业目前被广泛作为标准化测试的ResNet-50中,含光800推理性能达到78563IPS,刷新了AI推理芯片的世界纪录。

如果站在大众舆论中看,或许我们很难把阿里和“最强AI芯片”这两件事联系在一起。也许会认为其中充满了反常识和突如其来。

但如果站在计算与智能产业的时间迭序上看,或许会又对含光800抱有完全不同的看法:这枚最强AI芯,并不是阿里的转型之作。反而阿里始终在践行为产业提供最强AI算力的路上。平头哥的第一次“云栖秀”,则是这条路上自然而然酝酿的结果。

从云到AI,阿里就像一位游戏玩家,再每一个版本的副本中都拿到了关键道具。而在快速流转的AI时代,这些关键道具组成了“阿里套装”——作为产业底座的最强AI算力,就是这个套装的加持效果。

从云、大数据、算法到芯片,云栖的叠影凝固成了AI计算之路。

神奇AI算力在哪里?

或许我们有必要先了解这样一个理论:AI算力的差异化供给,究竟来自于何处?

去年5月,OpenAI 发布过一份数据报告。其中提到自2012年以来全球AI算力需求在6年中扩大了30万倍,AI产业的算力需求每3.5个月就在翻一番。

这个远大于摩尔定律增长的需求裂变,意味着AI算力在这个产业周期里必然面对大量供不应求的局面。这也就锚定了AI算力提供的第一条规则:云是AI的最佳出口。

由于云端算力天生具有能够裁量提供的特点,这对于AI任务从训练、测试到部署中广泛面对的弹性增长、大规模并行部署、极端训练用算力等几大特点来说,具有难以取代的价值。瞬时性、并发性、弹力性,是AI对算力需求的基本面貌。

而在从云到端、从训练到推理、从部署到迭代的AI落地过程里,我们可以看到AI算力的运行实际上受制于非常多的条件:计算架构、训练集群性能、框架对算法的优化程度、部署环境等等都在影的响AI算力的最终实际体验。这个漫长的流程,决定了AI算力的第二条规则:算力性能的优越与否不取决于单纯的芯片,而是由从芯片、云、数据处理能力、框架,再到算法开发基础、部署环境等一揽子条件来决定的整体阈值。

这意味着,AI算力不是一个单纯的部件性能比拼,而是一个体系化工程,是产业技术叠加与AI基础开发部署探索的完整序列。这意味着AI算力是一条路,这条路,需要不同时间的不同馈赠。

在时代收获所需,这正是阿里云的特点。

云计算时代,飞天的路标与馈赠

我们知道了AI算力来自哪里之后,就可以来看阿里云的收获过程。虽然我们今天的焦点是平头哥,但故事的开端其实早在十年前就已经发生。

2009年,草创的阿里云写下了第一行关于飞天的代码。当时这个“冒天下之大不韪”的团队,就意识到大规模计算是未来互联网的发展中轴,甚至是更多计算迭代的肇始因缘。

时至如今,这个判断应该说已经被证明是正确的。阿里云自研的飞天云操作系统,已经成长位国内规模最大的计算平台,可扩展至10万台计算集群,单日数据处理量超过600PB。2018年双11期间,阿里云弹性计算能力累计超过1000万核,相当于10座大型数据中心,创造了“脉冲计算”的新纪录。双11作为一个巨大的数据任务,某种程度上位飞天挺入智能时代,成为计算底座提供了验证。

AI计算的本质,是对异构计算和多样性计算的需求。为此,阿里云提供在云服务市场率先提供了异构计算服务。构筑了亚洲规模最大的GPU公共云服务,并可在短时间内实现全球最大规模的GPU服务器调用,超级GPU计算集群支持每秒10亿次AI峰值计算。此外,阿里云还最早发布了FPGA云服务。

这些基于云服务提供的大规模计算和异构计算,可以看作阿里云最早投身公有云事业,在产业草莽期积累的时代馈赠。云计算的支柱能力和多元架构囊括,是产业AI所需算力的基本构成。这层叠影成为了阿里云提供AI算力的底色,是一切故事的起点。

而在AI逐渐并入产业视角时,坐拥强大多元的云,让阿里可以更凶猛投身这个新的产业纪元。

AI探索时代,向实而生的阿里三叉戟

假如说,十年之前是公有云时代的崛起;那么从2016、2017年开始,AI时代逐渐在产业服务市场落地生根。

这个阶段,早期探索同样艰难充满挑战,但也给阿里的AI算力之路带来了第二层底色:实用化。

2016年的云栖大会,阿里与杭州一同公布了城市大脑计划。此后,随着城市大脑计划的陆续落地,阿里在2017年宣布成立了达摩院。此后的产业分工,是达摩院承担AI算法的开发与升级,而技术则通过阿里云的AI解决方案与阿里生态进行应用转化。

这一过程中,我们可以看到阿里的技术体系牵引起了AI算法、数据应用,与产业场景三个维度的走廊,构筑了一把探索AI真实价值的产业三叉戟。

达摩院的AI技术与服务体系,先后在工业、遥感、医疗、城市大脑等多个应用场景中落地。而阿里小蜜、拍立淘、支付宝、天猫精灵则成为了阿里内部生态的AI出口。根据阿里巴巴在杭州云栖大会上公布的人工智能调用规模:每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,阿里已经成为中国最大的人工智能公司。

在AI应用时代早期,阿里通过一系列技术和组织部署,形成了技术先锋营、数据转化引擎,与场景实验室的三个新角色,为AI算力走向实用化探索了落地入口。

AI芯片时代,平头哥的万里长征

如果对比CPU在70年代的历史,可以发现AI从探索期走向实用化和成熟期,关键标志就是核心芯片的大规模商用。

这个时代才刚刚开始,我们或许还无法代替计算史为它命名,但毫无疑问AI的芯片级基础设施,是这个周期的关键开端。

曾几何时,IBM从打印机走向了芯片让美国人莫名其妙;而去年,阿里宣布成立面向AI时代的平头哥,确实也让中国人大吃了一惊。

气质独特,生死看淡的平头哥,在计划中将为产业提供最全芯片产品形态,涵盖处理器IP、SoC平台以及芯片。

不久之前,我们见到了平头哥发布了面向端侧的无剑平台和玄铁处理器IP。而当含光800面世时,则意味着平头哥第一次挺进云端,与阿里云的计算、数据、算法体系连为一体,构成了云端最强推理算力的萌芽。

含光800性能突破,得益于达摩院的软硬件协同创新:硬件层面采用自研芯片架构,通过推理加速等技术解决芯片性能瓶颈问题;软件层面集成了先进AI算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

虽然平头哥的万里长征刚刚开始,但是这第一步,确实已经跨了出来。

关于未来时代的叠影,平头哥用含光800做了一声怒吼,它的意思大概是,阿里将突入最底层,在计算基础设施中完成对AI最强算力的探索。

云,AI,到芯片,三个时代的叠影,让最强AI算力自然流淌而出,云气万物里。

(0)

相关推荐