【独家】最“冒险”AI芯片亮相,NovuMind吴韧与他的“暴力美学” | 甲子光年

编辑:火柴Q、甲小姐 采访、撰文:小青狐

设计:孙佳栋  微信公众号:甲子光年(ID:jazzyear)

NovuMind(异构智能)创始人吴韧的脸上常常露出一种“我知道他们都错了”的微笑。

一个月前,在「甲子光年」采访各大AI芯片公司时,吴韧曾透露,他们即将发布的芯片,性能将远超同行。

美国当地时间1月9日,吴韧如约在CES首次展示了其AI芯片NovuTensor系列首款demo。

吴韧称,这是目前世界上唯一一款能实际运行的、性能达到主流GPU/TPU、而性能功耗比大大领先的AI芯片——相比目前最先进的桌面服务器GPU,NovuTensor仅使用1/20电力即可达到其1/2的性能

他补充说:CES展示的仅仅是FPGA版本,等正在流片的ASIC芯片正式出厂,性能将提高4倍,耗电将减少一半。

值得注意的是,吴韧定义了芯片的新物种

当所有芯片设计者都在传统二维矩阵结构上“搭积木”时,吴韧推翻了传统做法,直接从头搭建了一套新的底层架构:三维张量。

这种做法,舍弃了结构上的大而全,以换取把深度学习的算力逼向极致。

此前,一些业内人士曾向「甲子光年」表示,对NovuMind的技术路径“看不懂”;吴韧自己也坦言,许多人觉得NovuMind很冒险。

但争议并不影响吴韧的自信。

“我的芯片是最好的,”吴韧告诉「甲子光年」,“当我们对AI了解得足够深以后,我们敢做别人不敢做的决定。”


NovuTensor现场演示识别效果,每秒识别300张图像

被忽略的第二个公式

真正的趋势什么?吴韧的回答是:异构计算

在硅谷吃早餐时,他指了指桌上的果酱、餐具:“你信不信,以后这些小东西上可能都会有一个芯片。它们都将是智能的。”

吴韧在人工智能、尤其异构计算方面经验丰富:1990年赴美,先后任惠普实验室、CUDA研究中心首席研究员,AMD异构系统首席软件架构师;2013年加入百度IDL,作为百度“杰出科学家”,率团队研发了世界最大的专为深度学习定制的超级计算机,刷新了计算机视觉领域记录。

雷锋网创始人林军曾评价他:“高性能计算专家吴韧带领他的团队杀到计算机视觉的圈子里,用他们从来没有听闻过的打法让CV圈内的人有不战而降的恐惧。”

2014年的GTC大会上,吴韧提出一个公式:

“大数据+深度学习+高性能计算=更高智能”。

这个公式后来出现在各大国际科技巨头战略宣传的话术中。但吴韧告诉「甲子光年」,当时他其实还写下了第二个公式:

“大数据+深度学习+异构计算=成功”。

“大部分人都没有认识到第二个公式的重要性。”吴韧说,他们没有认识到,只有异构计算,才能把深度学习的计算能力推到极致

目前,AI芯片军备竞赛已白热化,巨额融资,群雄逐鹿,AI芯片已迎来战国时代(见甲子光年日前文章《芯片战国时代》)。

所有人都在传统芯片的矩阵结构上做改造,只有吴韧不是。如果你很熟悉每一块积木,你就没必要在已有积木模型上新搭一块,你可以推翻了从0做起,这样才能逼近极致。

 “对AI了解得足够深以后,我们敢做别人不敢做的决定。”

于是吴韧动起了手术:完全舍弃二维矩阵运算,采取3*3的独特张量处理架构,只处理三维的深度神经网络计算——这将大幅提高能耗比和晶片效率。

为什么这么做?

他评价其他玩家的思路:“当你的上下游都在别人手上,你唯一的选择就是满足每个人的需求,设计变得大而全,浪费了很多非常珍贵的资源。”

他口中“珍贵的资源”指芯片算力,当你全盘皆顾,不敢舍弃二维甚至一维的计算方式,就束缚了将算力性能逼向极致的可能。

吴韧不愿这样。

NovuMind自然也面临照顾上下游不同需求的问题,而吴韧之所以敢割舍和聚焦,是因为他确信:深度学习会成为主宰

“这一轮的进步,在我眼里就是‘结构’,”异构计算的核心思想,正是不同结构的“术业有专攻,“比如一些计算明明可以让CPU做,为什么要占用深度学习的计算能力?”

他说,大部分人不敢只做深度学习,是因为他们还没想清楚深度学习和人工智能的关系。说到这儿,吴韧再次露出一种“我知道他们都错了”的微笑:

让深度学习就做深度学习,别用别的东西干扰它。

NovuMind在CES 2018上展示的大屏截图

虚高的芯片指数

每款AI芯片,总包裹在一系列数字指标中走入我们的视野。

目前,每个玩家都能拿出一手漂亮的数字:比如每秒实现多少万亿次浮点运算,功耗多少瓦,实现多少存储。

“哪怕是国外半导体行业最顶尖的记者,他还是愿意把这个东西归到一两个数字来描述,但这样的评价没有意义。”吴韧再次显示了他对主流的漠视。

他打了一个比方:“一个楼可以住1万人,但是你只修一个电梯,电梯一次只能装8人,那这栋楼是住不满的,你的电梯是限制。所以浮点运算并不能说明问题,房间数是一个理论极限值,电梯没设计好,人是进不去的。回到芯片,就是你数据流不进去,流不出来,光有计算能力是没用的,所以现在所有人报的数字都是虚高。”

“我们为什么要做芯片?是要解决具体问题,你不要浪费。你单位时间或单位用电能解决多少问题?这才是正确的度量办法。”

吴韧举例,在计算视觉领域,要看检测和分类的能力:每秒钟能识别多少张图像?每张图像能检测多少个目标?

在功耗12w的情况下,NovuTensor每秒可识别300张图像,每张图像上,最多可检测8192个目标——相比目前最先进的桌面服务器GPU(250W,每秒可识别666张图像),仅使用1/20电力即可达到其性能的1/2;而相比目前最先进的移动端或嵌入式芯片,相同用电的情况下,性能是其三倍以上。

这些指标并不是他自豪的全部。“真正的不同,是我们的视界。我们是领导者而不是追随者。”


NovuTensor现场演示检测效果,超实时(延时小于15ms)每张最多检测8192个目标

深度学习的暴力美学就是终局

学界一直有种声音,说深度学习不一定是人工智能的终极解决方案,一部分人正在等待新的理论突破去取代深度学习。有人说,深度学习是大数据处理小问题,人类智能则是小数据解决大问题。

但吴韧却斩钉截铁地告诉「甲子光年」:深度学习,正是人工智能的“way to go”,不太可能被新的东西颠覆。

进入餐厅时,门口跃过一只松鼠。吴韧问我们:“为什么能认出来这是松鼠?”

实际上,这是一种基于过往认知经验的“直觉”,而这正是深度学习的方法:

人类通过钻研棋局、训练来获得“棋感”,当遇到类似情况就会做出本能的反应;深度学习同样如此,通过“见多识广”,用大数据去训练“直觉”。

 “爱因斯坦说过,真正有价值的东西就是直觉。”吴韧对深度学习的信仰,近乎一种审美的追求。

他说,大多数人都更欣赏一个由因果关系所解释的世界,比如欧几里得公理,牛顿定律,自然常数。大多数人期望世界是被少数清晰的底层规律“解释”和支配的,但他却更欣赏深度学习的“暴力美学”:

一个黑匣子,里面有海量的未知参数,通过几近鲁莽“力迫”的大规模数据训练,这个黑匣子最终产生了表达一切的能力。

吴韧说这不是混沌和复杂,这里面有真正的简单:

“如果深度学习能够解决问题,所有的公式都没法描述,但所有公式又都被包含,这才是真正的漂亮。”

NovuTensor能将普通电视转化为8K超高清电视

“不管他以前公司多牛,

反正没我们公司牛”

吴韧在趋势判断、芯片设计上大胆、锐气;与此形成反差的是,NovuMind CES的展台相比其他公司布置得很简单。

CES开幕当天,「甲子光年」花了不少功夫才找到其展台,场地不大、装饰朴素,和旁边几家中国AI公司形成鲜明对比——吴韧似乎无心参与这场“阵仗竞赛”。

在NovuMind展台,最显眼的是几台显示器,演示着NovuTensor的图像识别能力。

吴韧在CES 2018现场为观众讲解

低调的布置和NovuMind目前的团队构成有关,硅谷、北京两地团队目前总共50多人,只有6人是非技术人员。总的来说,NovuMind是一家曝光度和PR手段都比较有限的公司。

吴韧承认公司目前在人才结构上的不平衡,他还顾不上太多别的事情,目前,他仍把主要精力放在开发核心技术上。他招人只看重两点:第一,他要真正热爱这个事情,要有足够强的自驱力;第二,他要足够聪明。

吴韧不太在意这个人之前的经验:“反正都要教的。”他半开玩笑地说,他不在乎员工以前的公司牛不牛,“反正都没有我们公司牛。”

从以往历史看,吴韧挑人的眼光很不错。他在百度的学生几乎全部成长为国内一线AI创业公司的中流砥柱。

从左至右依次为:孙刚 (Momenta研发总监、2017ImageNet世界冠军)、孔畅(商汤科技异构并行计算部门经理)、单羿(深鉴科技CTO)、吴韧、颜深根(商汤科技研发总监)、党青青(百度);还有一位吴韧的学生不在图中:刘文志(商汤科技自动驾驶高级总监)

但在科技行业,如何吸引、留住人才是所有公司的难题。百度的这些学生仍与吴韧保持着很好的关系,但他们没有一个人加入NovuMind,吴韧也没打算游说他们,“他们已经发展得很好了。”

要成就一项伟大的事业,需要极致优秀的人才;而极致优秀的人才,往往在第一天就会被所有对手盯上,并抛出巨大的诱饵。

创立NovuMind以来,吴韧在逐渐学会平静地面对人才的来去。

第一次有人提出离开时,他经历沮丧:自己做的事这么牛,怎么会有人想走?慢慢地,他开始接受:有人来就有人走,这本是世间常态,并不会对谁特殊。他坦言:“流失率应该说是不低的。”

当「甲子光年」追问这种流失率的来源,吴韧将NovuMind描述为一艘飞速上升的火箭:每个人都在这里得到提升,而当到达一个高度时,有的人就选择了离开——从NovuMind离开的人中,有人去了三星,负责与苹果的移动端GPU竞赛;有人去了新加坡,成为智慧国家整体负责人。

他们为什么不继续留下来,随火箭飞往更高的地方?

吴韧摇摇头:“这也是我的困惑啊。”

“在硅谷2分钟睡着,

回国需要4分钟”

一个不可否认的事实是,相比国内AI公司估值的快速增长,仅在2016年下旬完成1500万美元融资(由洪泰基金和宽带资本领投、真格基金和英诺天使跟投)的NovuMind在这方面并不激进。

NovuMind团队主要在美国,这是吴韧目前唯一比较担心的地方:他害怕硅谷的慢节奏会让公司跑得不如国内同行快。

“我在这边都是上床两分钟就睡着,到了北京要四分钟,”吴韧苦笑了一下,“国内压力大啊。”

吴韧计划在今年加速国内团队的扩张:除了北京分公司,深圳、广州也纳入考量。

然而,以目前人工智能人才的紧俏程度,扩张意味着支出大大增加。而根据之前另一家AI芯片公司的估计,完成一款芯片的设计、流片、生产就需要1500万美金——这刚好是NovuMind的A轮融资总额。

好在,NovuMind新一轮融资已基本敲定,第一款芯片的流片虽尚需一个多月才能完成,但客户的订单已经有了——吴韧透露,今年芯片销售一百万片没太大问题。

在本次CES上,NovuMind展示的是主要应用于云端数据中心和开发系统的28nmFPGA芯片;正在流片中的28nmASIC芯片将主要应用于终端的安防、自动驾驶;下半年推出的FinFET(16或14nm)ASIC芯片将作为主打,覆盖全场景;到2019年底,最新工艺的ASIC芯片将推向市场,同时预计公司达到收支平衡,全部芯片销量超过1000万片。

“到那时,才能说我们奠定了自己的行业地位。”

吴韧承认,自己擅长技术,不擅长商业。因此,NovuMind采取了合作的办法:合资成立国内首家人工智能消化内镜医疗科技公司「希氏异构」,与华西医院深度合作,并已经完成3000万元Pre-A轮融资。

与华西医院的合作,能够帮助NovuMind获取丰富的医疗数据。吴韧说,许多国内的公司,用800份、2000份病历就训练出一个模型,准确度根本不够。谷歌做糖尿病和皮肤癌的诊断,用了10万份以上的数据,而NovuMind做消化道疾病诊断用了20万份数据。

未来,在各个垂直领域,NovuMind都可能采用合资公司的办法,自己专注技术,在商业化上与他人合作。

“这是做技术的朴素逻辑,”吴韧说,“对于核心零部件,当你比所有竞争对手做得都好,客户就只能选择你。英特尔如是,英伟达如是,NovuMind也将如是。

地中海上的思考

骨子里,吴韧是个技术专家,而不是一位商人。他的自信最初来自技术天赋,如今也表现在对技术道路的坚定上。

文革期间,上小学的吴韧就开始玩无线电:矿石机,一个晶体管,四个晶体管,七个晶体管,不同型号收音机一直往上做。1978年改革开放时,15岁的吴韧靠看电路图造了一台电视机,连壳都是自己做的——此前他从未亲眼见过电视的实物。

回忆起这段往事,吴韧说:“只要我真正想做的事,就一定能做到。”

但在技术之外,总有事不受“聪明”和“认真”的控制。

2015年6月,ImageNet主办方宣布百度在ImageNet测试过程中作弊,违反规则,超过了每周2次的提交。百度随后承认了违规行为,团队负责人吴韧被开除。

吴韧的离开在业内引起争议,一部分人将其解读成百度的“双吴”(吴恩达、吴韧)内斗。

商汤科技创始汤晓鸥曾仗义执言:“实际上这段时间的结果并不是真正意义上的参赛结果,因为比赛是有截止日期的,所以百度并没有任何竞赛中‘作弊’的动作。”

离开百度的吴韧说自己事后反而平和。随后,他带着妻子,踏上了地中海邮轮。他们在海上漂流了12天,全程不用手机,吴韧开始思考。

正是在那段时间里,他想好了接下来要走的路:

未来,智能将更多发生在散落各处的应用端上,高效、节能的本地计算会呈爆发式增长,此刻正是一个窗口期。将来,AI芯片定会“Winner takes all”(冠军赢得一切),但目前尚未有人占据主导地位。

他做出了判断:这个领域一定会有新的巨头崛起,用异构计算做出真正属于AI的芯片,NovuMind可能会赢。

两年半后的今天,在硅谷,吴韧曾一边开着快车,一边告诉「甲子光年」:“前几天开车太快,got  a ticket(吃了张罚单)。”

他说他开车“不喜欢前面有人”,做事也一样。

“开车是我最放松的时候,”他喜欢在开快车的时候思考,“开车是个直觉基本上能搞定的事情,我们的大脑是空出来的。”

我们的对话之中,吴韧多次说到了“直觉”。他对深度学习的直觉,对结构的直觉,对趋势独辟蹊径却斩钉截铁的直觉。

正是这种直觉,让他敢于像一个拥有“棋感”的冠军棋手一样“押注”。随后他想了想,纠正了这个说法:“直觉”一词不够准确,实际上是建立在以往经验上的“Educated Guess”。

AI芯片行业会否是异构计算的天下,新的巨头将如何崛起,如何变革商业——验证这个“Educated Guess”,需要一段不短的时间。整个过程,将牵动万亿级的产业,波及上下游诸多竞赛之中的变革者和守旧者,并最终影响每个人的日常生活。

(0)

相关推荐