一知智能陈哲乾:做能“懂你”的AI机器人,用算力实现更多可能
陈哲乾
杭州一知智能科技有限公司创始人、执行总裁
文字|张向芳
图片|王 毅
电影《钢铁侠》中小罗伯特・唐尼和AI助理贾维斯的交流画面,经常在陈哲乾的脑海中萦绕。
——不管是起初测试钢铁侠套装的数据,还是高空飞行时需要帮助,小罗伯特随时随地可以唤出贾维斯。随时待命的虚拟助手根据对话内容,完美解决面前的一个个问题。
陈哲乾觉得,科幻电影中的镜头,其实离人类并不遥远。
要在现实生活中拥有AI助理,自然语言处理(NLP)是一个出发点。作为人工智能中最为困难的问题之一,NLP能够缩减人与机器之间的交流差距,而这正是陈哲乾团队的一个技术优势。
从2011年到浙大读计算机专业开始,到读博第三年创办杭州一知智能科技有限公司(以下简称一知智能),1993年出生的陈哲乾跟人工智能已亲密接触了将近10年。
作为一知智能的创始人、执行总裁,陈哲乾带着公司走在人工智能充满魅力和挑战的道路上——专注于人机交互领域,给机器装上中枢大脑。
短短三年多时间里,年轻的公司交出令业界瞩目的成绩单——
团队和微软联合推出的FastSpeech语音合成系统,使机器的语音合成速度提高270倍,为目前业界合成速度最快的领先算法。
成立两年即融资1.3亿元,在国内NLP领域创业公司中名列前茅。
作为一家技术驱动型公司,一知智能获得多家权威机构的认可。2019年度杭州市领军型创新团队榜单里,一知智能榜上有名。获批的9家团队中,还有阿里巴巴、海康威视等知名企业。
2019年最具成长性to B企业、2019年最可能改变未来世界企业、机器之心中国十大最具潜力早期AI公司等多项荣誉,也被他们默默收入囊中。
今年7月份刚刚博士毕业的陈哲乾说,“一知”的意思是“一问便知”,他们要做出最聪明的语音交互机器人,为企业提高效率,用科技给人们送去便利。
选择这个方向创业,让陈哲乾“每一天都充满希望,每一天都满怀激情”。
1
能“读懂”人的机器人
“虚拟人”小知,跟真人主播没啥差别
一知智能引起过很多业界专家、政府领导的关注,最近一次吸引的,是中国工程院院士潘云鹤的目光。
在10月中旬举行的第二届中国(杭州)国际智能产品博览会暨2020全球人工智能大会上,潘云鹤院士在一知智能的展位前驻足良久。
这位浙江大学的老校长、中国人工智能领域的开拓者之一,如此看待一知智能的人机交互研究方向:“有很大的应用前景和想象空间”。
在营销和客服场景,机器人被使用的频率越来越高,很多人可能都不陌生。但要遇到一个能说会道,能“读懂”人,具有“人的温度”的机器人,却并不那么容易。
在萧山区的杭州湾信息港,一知智能的虚拟客服“小知”,令人惊喜地看到机器模拟人的程度可以何种逼真。
陈哲乾在电脑上噼里啪啦输入一行字,具有高颜值的“虚拟人”小知马上用设定好的或柔美或严肃的语气讲出这句话,讲话过程中唇音同步,从神态到唇形都呈动态变化,跟真人主播无异。
以电话为载体的第一代产品“语音客服”,同样表现出色。现场实验了一个售后服务的多轮对话,从“你好”到“祝您生活愉快”,气氛融洽的8轮对话一共进行了1分50秒。
在人机交互中,多轮对话是一个核心技术。市面上相对智能的机器人,通常对话时间不超过一分钟。但在一知智能切入的电商场景下,机器跟人的对话时长可以达到平均73秒。
不只是多轮对话,机器还能识别情感。比如说用户是开心还是不耐烦,机器都能识别出来,并会根据不同的情绪配置不同的话术。
“几百万通电话下来,平均通话时间越长,代表人越乐意跟机器去交流。”聪明的机器人,是陈哲乾追求的产品效果。
创业之初,陈哲乾曾去企业的客服中心体验过一周,一天电话打下来,到了晚上人都是懵逼状态。人工一天打200个电话已是极限。对企业来说,管理成本高,人员流动性大,是亟待解决的痛点。
如何帮员工减负、帮企业降本增效?利用人工智能来代替高重复性的人员工作,无疑是最好的选择。
目前,一知智能合作客户近3万家,其中不乏华为、腾讯、阿里巴巴、国家电网、中国银行等这样的大客户,客户覆盖了电商、教育、金融、政企等领域。
疫情期间,一知智能的智能语音机器人被大量用于通知、回访电话,提醒打卡电话。在国家电网的营业厅、电商“双11”“双12”订单尾款催付中,一知机器人也都发挥出重要作用。
以国家电网为例,一知智能每月为其拨打80万交费提醒电话,用户覆盖浙江省11个地市,截至目前累计催收电费金额7.2亿元。电费回收时长平均缩短两天, “机器代人”减少人工催费工作量近40%,预计一年可减少近2亿元的人工成本。
而一知智能的第二代产品“虚拟形象数字员工”,最近也应用于无人营业厅,实现的是“跨媒体多模态人机交互”。陈哲乾解释说,就是将语音、视觉、触控等多种传感器模态组合起来,实现机器跟人的智能交互。
传统的自动终端机,可能旁边还需要一个大堂经理帮忙指导用户如何操作,通过“虚拟员工”的多模态交互,不仅可以听懂问题,还能根据用户需要调出画面,“手把手”教用户操作,更加灵敏和智能。
潘云鹤评价说,“这种跨媒体多模态人机交互产品,是支撑未来机器与人多维度、跨媒体交互,建设‘数字中国’的大势所趋。”
2
含着金汤匙出生的一知智能
曾经的比赛牛人,通过创业挖掘人机交互的魅力
从2011年来杭州读大学,陈哲乾已经做了9年“浙大人”。
大二那年,他看到微软发布的一个关于未来的概念视频,对视频中描述的泛屏时代印象极深。刷一下卡,桌子、车窗都可以成为电脑屏幕。人工智能引起了陈哲乾的兴趣。
大四快毕业时,他在保研和直博中选择了后者,进入浙江大学国家重点实验室——计算机学院CAD&CG实验室,从事人工智能人机语音交互相关研究工作。他希望自己能成为人工智能方面的专家。
读博期间,陈哲乾很拼,前两年就满足了博士毕业的要求,还经常去国外参加各种比赛和演讲。
各种比赛中最牛的一次,当属2017年获得SQuAD机器阅读理解比赛全球单模型组第二名,排名仅次于微软。
SQuAD 是由斯坦福大学于2016年推出的数据集,被誉为自然语言处理领域金字塔尖的比赛。自发布以来,吸引着谷歌、微软亚洲研究院、IBM研究院、阿里巴巴达摩院等众多国内外知名研究机构和高校的目光。
在AlphaGo火起来的2016、2017年,人工智能受到国内天使投资机构的强烈关注。也正是在这种情况下,天使轮金沙江联合资本对一知团队有格外的关注。毕业于浙江大学的王国成,“邀请”这支团队出来创业。
当时陈哲乾还在读博士,团队经过调研,发现市场需求巨大,而且当时市面上并没有像样的人机交互产品。
而人机交互是浙大的一个看家本领,一群技术男觉得有责任发挥其价值。
“干吧。”
2017年8月,一知智能成立。
萧山区政府的大力招引,可以说是把一群技术男变成创业者的另一个“神助攻”。
陈哲乾记得,当时只有一个PPT,萧山区领导听了他们的介绍,20多分钟就决定引进项目,并且给了办公场地和资金支持。
用陈哲乾的话说,“ 我们那时候也算是含着金汤匙出生的。”
公司成立半年,一知大脑做了出来。凭着技术在业界崭露头角的一知智能,受到不少公司关注,包括某行业巨头也曾找上门来邀请他们加入。
现在的一知智能,从10几人的公司,发展成了拥有近150号人的大公司。快速发展离不开技术与商业并重的创始人团队。
创始团队中,同学李一夫是首席技术官。同样是90后的联合创始人顾泽良,被他们从金沙江联合资本的投资岗位上“拉下水”,成了公司CMO(首席营销官)。
3
录入10句话,你就能成为“歌手”“故事大王”
在他的想象里,《钢铁侠》里的AI助理有可能实现
陈哲乾身上有种沉稳和自信,凡是见过他的人,很容易保持一致看法。
这个24岁开始创业的人说,创业是一个正确的选择。
“用我最熟悉的技术做最喜欢的事情,而且还能做得比别人好一点,这种感觉很奇妙。”他如此形容他的创业。
年轻的一知智能已经走上了正轨,深受客户好评,而且实现了盈利,账面资金充足,对陈哲乾来说,“我现在每天想的是如何让他更好,每天看到的是希望。”
他深知自主研发能力对科技型公司的重要,所以一边抓产业化落地,一边搞算法攻关,研究底层技术。
因为重视人工智能前沿算法的基础研究工作,公司成立之初便设立了浙大·一知人工智能联合研究院。目前一知团队硕士、博士有40多人,员工中80%的科研人员来自浙江大学、英国帝国理工大学、英国巴斯学院、香港科技大学等知名院校。
浙大·一知人工智能联合研究院揭牌仪式
陈哲乾说,研发人员是公司的宝贝。浙大·一知人工智能联合研究院的学弟们,跟曾经的他一样,研究起黑科技来可以通宵达旦。
比如今年陈哲乾给他们定了一个课题,“如何用尽可能少的样本,训练出最拟人的效果?”
他们交出的黑科技,好玩有趣。
陈哲乾给我们听了一首《隐形的翅膀》,甜美的声音听起来跟唱片没区别,但实际上却是用机器合成的。问其原理,用到的是音色克隆技术。
一个人在安静的环境里录几句话,一知大脑就能捕捉到其音色特征,把声音、乐谱合成后,你就成了拥有动听歌喉的“歌手”。
同样的,通过音色克隆,机器会模仿家长的声音给孩子讲格林童话,也可以模仿子女的声音陪伴老人。
令人叫绝的是,一知大脑录入的样本足够小——10句话就够了。而导航上听到的林志玲的声音,据说至少要录一天,可能要读上3000个句子。
因为公司强大的科研基因,黑科技被源源不断地创造出来。一知智能研发的语音合成算法二代,速度比谷歌的算法快了400倍。
在自然语言处理中,一知机器人也更聪明。不按常规顺序地反问句、倒装句,粤语、四川话等方言,机器人都能“听得懂”“听得清”。语音识别和语义理解比普通智能机器人更胜一筹。
“机器会越来越聪明,让机器去适应人,这是我们的憧憬。”
通过自主研发的语音语义算法引擎,一知大脑在电话、自助终端机两个载体上开出了一连串鲜艳的花,智能语音、智能呼入、智能在线客服、智能质检、坐席辅助、虚拟数字人等产品功能和服务,深度赋能客户企业,帮助企业在数字经济时代建立核心竞争力。
围绕人机交互,一知智能还在不停寻找新的载体。比如说眼镜、桌子、窗玻璃未来说不准都会成为载体,人类“唤醒”一下,全息投影的虚拟人从空中冒出来,跟人进行对话。
在陈哲乾的想象里,《钢铁侠》里的AI助理,微软概念片里看到的场景,都有可能实现。
“我是一个对科技充满幻想的人,我觉得这一切都可以期待。我希望有一天是我们公司,把《钢铁侠》里的AI助理亲自做出来。”
4
曾经的苦行僧在“open”生活中快速成长
他在“静”中修炼,在“动”中成长。
如果分别用一个字来形容创业前后陈哲乾的不同,专心读博时他偏“静”,创业后却不得不处于各种“动”中。
他在“静”中修炼,在“动”中成长。
读博时写代码,看满是公式的全英文论文,都需要心非常静。读博时过着苦行僧一样的生活,心无旁骛,不要想任何事情,“如果一个博士比较open的话,这个博士一般会读不好。”
现在的他,几乎全天候处于“open”状态。
为了让自己尽快成长,他看书,交流,网上看视频,积极参加浙大校友会等组织,虚心向人请教。因为经常出去交流请教“混圈子”,去年瘦了十斤的他,今年又重了十斤。
在浙大一个创业社团,上市公司每日互动创始人方毅成了他的企业导师。从方毅那里,他说学到书本上学不到的知识。
实际上,刚读大学时陈哲乾就知道了鼎鼎大名的学长方毅,并且加入后者组建的创业精英会。大三时他曾创过一次业,跟同学一起做了个校园社交APP,多的时候2000多号人同时在线。
创业过程中,走过弯路踩过坑。陈哲乾印象深刻的是,2018年7月份,团队没日没夜开发产品,眼一睁就干活,困了就睡公司。搞了一个月,结果发现这个版本bug太多。毅然全部推翻,从头再来。
“技术男比较理想化,一来就想建世界顶尖的摩天大楼,实际上连小土房都没建过。那个版本地基打得有点歪。”
陈哲乾从中领悟到,不论做什么产品,一定要用迭代的思想一步一步去做。
陈哲乾也纠结过,学术和创业能否二者兼得。公司的第一代产品,是他亲自画的原型图。前期语音识别、语音合成的人机对话算法,也是他带着团队做了工程化。他舍不得技术,还想自己写代码。后面发现根本不允许,赶紧往自己不擅长的管理方向努力学习。
他过着跟以前截然不同的生活。但相同的是,一切都是为了自己最喜爱的人工智能,而且他乐在其中。
一知团队中90后居多,平等的交流和讨论是90后的相处模式。有些员工说,“我是来帮一知上市的。”他接受这种自信。公司学习氛围很浓,他喜欢大家在一知夜校里看书分享的氛围。
他脾气很好,说话慢条斯理,没有波澜。但同时又极有原则,他希望公司小伙伴都是一种正面积极的形象。
三年前总是论文、代码不离手的陈哲乾,在德鲁克的书中学管理,在《菜根谭》《孙子兵法》和心理学书籍中,学着读懂人心。在商业模式的寻找中,他逐渐把握了航向的精准度数。他更看到眼下人工智能时代,一知智能的潜力和优势。
“在人机交互领域,聪明不聪明,反应快不快是最本质的东西,就像汽车的发动机,业界没几家能生产出来。领先的自研技术,让一知智能有绝对的优势和信心。”
在陈哲乾的想象中,人机交互智慧化服务的未来前景非常广阔,而一知智能,将为此不懈努力。
“未来将是一个万物智联的数字社会,人工智能将不断深度融入到生产生活。一知智能很荣幸能参与到这一伟大的历史进程,贡献我们的青春和力量。人机交互智慧化服务的未来前景非常广阔,比如基于人机互动的双边关系,终端客户单向度向全生命周期管理演变,真正实现大数据‘精耕细作’的巨大价值;比如由可听可看可用向交互赋能迭代,激活体验场景价值,带来更多的自由、更多的选择。未来一知智能将为社会提供百万名数字员工帮助政府、企业实现智能化重塑转变,解放简单重复劳动力,让越来越多服务实现‘不见面’,使我们生活变得更智慧、更聪明。”
在人工智能的三个重要赛道里,人脸识别有商汤科技,语音识别有科大讯飞,人机交互领域,一知智能能否成为最耀眼的星?
未来可期。
对话
Q
你有欣赏的人吗?
陈哲乾:方毅是一个。我刚进浙大的时候,他是创业精英会的会长,这个社团是他办的,这么多年一直听大家讲他。那时他不认识我,但给了我创业的火苗。他是我创业方面的一个引领者。
我的导师赵洲,我也很欣赏。他不计名利的性格与严谨细致的做事风格一直影响着我。他曾说,希望自己辅导过的学生走向社会,有志成为对社会有贡献的人,能迅速超过他成就一番事业。
Q
你觉得自己适合创业吗?
陈哲乾:适合。因为我是福建莆田的,我们莆田跟温州有点像,那种氛围里比较偏向于出去闯。创业一定是我很想做的一件事情。
Q
创业过程中会焦虑吗?怎么排解?
陈哲乾:会焦虑。担心自己能力跟不上,或者说眼界跟不上。每天醒来,有100多号人跟着你在跑。
创业没有人能够说一帆风顺,一定会踩很多坑。我们是做To B的公司,一定是需要慢慢扎根的,不像To C的感觉爽快,有时候也会觉得累。
以前读博士的时候也累,现在感觉是充实。这些焦虑和压力自己就会没了,不用排解。问题总会慢慢解决的,然后不停地再有新的问题出来,就是一个正常的状态。