企业服务机器人未来大趋势:将更注重交互
追一科技联合创始人 & CTO、TGO 鲲鹏会会员刘云峰博士
为此,我们邀请了追一科技联合创始人 &CTO、TGO 鲲鹏会会员刘云峰博士,在 TGO 鲲鹏会深圳分会走进名企活动中,分享追一科技 AI 机器人在企业服务中的实践。
以下内容来自刘云峰博士现场分享,在不改变原意的基础上有部分删减:
人工智能有三大领域:视觉、语音、语义。其中,图像和语音算法成熟度已经很高,且要远远高于语义。在中文机器阅读理解比赛中,人的准确率大概是 95%,机器做到的最高水平只有 80%,还有 15% 的差距,这是一个挑战,也是一个机会。
具体应用上,目前来看,比较多的人工智能公司,首先需要在企业服务方面落脚,这是最容易看到的商业模式,也是 AI 技术最容易被认可的一个商业模式。
今天主要针对企业服务机器人展开介绍。
首先说下企业服务机器人和聊天机器人的差别。第一,聊天机器人一般是虚拟形象,说话不要求很严谨,反而是比较风趣,这种机器人一般叫情感陪护型机器人。而企业服务机器人代表企业形象,代表企业去服务顾客,表达和对话都比较严谨,说话要负责,不能随便回答。
第二,两种机器人的技术路径也不一样,企业服务机器人是一个垂直领域,在专业领域和用户对话,而不是开放的聊天,从这个角度来看技术难度变轻了;但是和通用机器人相比,它对准确率要求更高。
然后接下来,我们来探讨怎么做好企业服务机器人。
想做一个客服机器人,核心要把语义理解、意图理解做好。举个例子,一个电商产品不同用户有不同的反馈,比如“要买的裙子怎么没有腰带?”或者“充电器为什么没有一起寄过来?”这些问题看起来很杂,但背后语义都是同一个,就是商品零配件少发了。
在解决意图理解上,技术路线上经历了好几轮变迁。2000 年左右就已经有企业服务机器人这种产品形态,只是当时解决意图理解的技术比较简陋。早期是用本体 + 句法模板的方式来实现,比如用本体完成理解词的问题,用句法模板完成理解对句的问题。
随后像百度、Google 等公司兴起以后,搜索技术也被用在客服机器人里。在这个阶段,一般用同义词的方式解决词关系的问题,用词权重解决抽象核心语义的问题,用文本相关性解决匹配的问题。
再后来深度学习技术出现,在语义理解上,深度学习相比之前的技术有很大提升。
那么深度学习,又是如何解决语义理解?
在计算机里面,用文本方式表示的语言,比如汉语和英文,是一种符号,但这不是计算机能理解的符号。计算机可以理解的是向量和矩阵,无论是语音、图像还是语言,深度学习都是把这些原始信号转换成计算机能理解的向量和矩阵,才能更好地做计算。
首先完成将语言当中的词转换为向量,然后通过一个深度神经网络转化成句的向量,再通过句的向量进行更丰富的计算。
这个过程中,会用到注意力模型,注意力模型最早来源于图像理解。举个例子,人进入到会议室,首先不会去注意有多少板凳,虽然板凳这些信息占据面挺大,但人首先会挑选自己注意的东西去看,比如说注意来了哪些人,因为人在触摸信号时会选择性地去挑选。语言也是这样,用户说了很长一段话,注意力模型能够在很长的文本中,发现用户主要表达的信号。比如一个用户说“昨天刚收到货,今天天气不错,和朋友一起出去玩,一劈腿裤子开衩了”,前面的话都没有意义,他最想表达的意思是裤子开缝了,是想退货或换货。对于一个客服机器人来说,这是它要抓住的重点。
注意力模型之后是映射层,相当于完成一个归一化,之后机器人才知道怎么去回复用户。
刚才讲的都是需要人事先把知识库整理好给机器人用,为在线机器人去解析、调用、推理。还有一类,可能所有的知识都是一些原始文档,它们没有形成知识库。比如一家银行有很多线下商家优惠活动的书面文档,这类活动经常更新替换,没有人可以完全记住这些文档内容,反而是机器比较擅长做这个事情。假设有一个用户问题,需要从文档当中找答案,首先机器要找到哪个文档可以解答,再找到文档当中哪一句话可以解答,这个过程叫阅读理解。
阅读理解在国外比赛已经做的挺久,国内才刚刚开始,这一块的技术还是比较新。
刚才讲了客服机器人在线处理用户的请求,理解用户的请求,其实客服机器人还做了很多离线的工作。一个机器人并不仅仅是一个在线的服务,它是一个离线服务和在线服务同时包含的系统工程。
机器人解答不了用户的问题,有时候并不是因为意图理解不够好,而是机器人没有知识去应对当前的回答。这就是知识库运营所要解决的问题,有几个方面:
一是新知识点的发现。有些热点的知识点用户已经在问,但是知识库里面是缺失的,这部分问题可以交给运营人员添加相应的问题回答。
二是知识点的细化。一开始机器人的知识点没有深入到用户的问题细节里面,这种情况可以细化,把一个知识点拆分成多个知识点。
三是知识点的优化。比如说客户看到了机器人回答,但是仍然转人工了,这是因为答案并没有解决问题,说明答案需要进一步优化。
除了返回用户答案外,机器人还需要更多能力,优化产品和运营。
一是热点分析。比如在一个电商后台系统中,用户请求有集中性或爆发性,那很可能是产品上集中的事故,这种现象跟产品运营息息相关。
二是舆情分析,可以挖掘用户在客服渠道里面经常会问什么问题。举个电商的例子,用户在问到奶粉这个词时,最关注的正品、渠道商、产地,还有品牌。通过这个方法,可以判断用户在关注某个商品的时候更关注哪些点。
三是情感分析。用户在访问机器人时,是正向情感、中性情感还是负向情感?这些可以通过技术手段识别出来。我们做过某个客户的统计,在售后客服机器人场景,中性和负向的情感占比较高,那就说明售后来找客服都是吐槽的。可以把这些负向的情感反应细化处理,比如分几个档次,分别对应后续不同的处理。负向情感比较严重,就可以让机器人自动转人工。
最后是敏感分析,这一点对于客服机器人非常重要。我们发现,不同行业有不同敏感信息定义。比如外卖,比较敏感的信息就是食品健康。对于电商,假货就是比较敏感的信息。一般遇到这些敏感信息机器人会主动转人工,交给人工客服处理。
前面我们讲了企业服务机器人的特点、如何解决语义理解、背后依托知识库以及产品能力,最后我想讲下企业服务机器人趋势。
大家一开始认为企业服务机器人是客服机器人,主要是解决节省人工成本,后来发现,它其实是企业的虚拟助手。包括 Gartner 最近的报告,预测到 2020 年有 20% 的用户访问企业服务时,首选的是对话式的入口。
以前 PC 时代访问银行网站,网页每个菜单对应办理某个业务的入口。到移动手机时代,屏幕没有那么大,APP 能放的入口也没有那么多,客户都想快速找到业务入口。如果放搜索框放在 APP 最上面,通过搜索功能,搜索“修改密码”会出来十几条修改密码的入口,用户也不知道哪一条,体验并不好。
所以,将来可能更多会是对话交互的方式,这是未来的趋势。比如说修改密码,机器就会反问你想修改什么密码,再根据你提供的信息,给你具体操作页面。
通过用户和机器人的交互,把用户画像沉淀下来,跨越时间和空间把用户画像融合在一起,对营销、推荐和风控做一些数据上的支持。客服中心从一个成本中心转变为一个用户研究中心,这也是一个趋势。
以上是我今天分享的企业服务机器人内容,感谢聆听,谢谢大家!
这个就是刚才讲到的情感分析,它包括两个方面,一个是文本,一个是语音,文本里通过相关词语可以去识别,语音会包含一些声调、语速。对情感的判断是满意还是不满意,也是用深度学习的方法,相当于是文本分类来解决这个问题,每个人沟通表达的方式不一样,想识别出来还是有点难的。如果是用关键词的方法,这个问题确实是很难解决好,用深度学习的方法会好很多。
方言这一块大家都做的不太好,讯飞是做的比较好的一家。这需要数据的积累,没见过的方言仍然识别不出来,这是一个门槛。另一个门槛是垂直领域,如果语音识别系统,没有一个垂直行业的训练数据,也做不好。
现在人工智能对数据依赖还是比较高的,人工智能的竞争有时候就是数据竞争。
券商对知识图谱要求比较高,希望通过机器人能够做到问股选股,比如查询“市盈率大于 20、小于 25 的股票”,比如查询“A 公司去年和今年相比市盈率变化多少”。在机器人的知识库没有现成的答案,需要通过推理才获得答案,再把它过滤出来。
另外是投资教育这一块比较多,经常会问港股通怎么收费等等。还有资料查询,主要是问某支股票的信息,比如说法人、去年的财报。