【NLP-ChatBot】能闲聊的端到端生成型聊天机器人背后都有哪些技术？

2024-06-23 20:08:31

我们之前介绍过，按照应用场景的不同，聊天机器人可以分为问答系统，对话系统以及闲聊机器人三类。今天我们就来详细讲一讲其中的生成型闲聊机器人。

作者&编辑 | 小Dream哥

1 什么是生成式聊天机器人

我们前面介绍的QA，会事先存在一个对话库，聊天系统接收到用户输入句子后，通过在对话库中以搜索匹配的方式，选择合适的回答返回给用户；对话系统，则是通过NLU和对话管理模块，驱动自然语言生成模块，返回相应的话术给用户。

总的来说，前面两种聊天系统通常面对的是一个封闭的场景，而生成式通常面对的是开放场景。因而很难像前面两种机器人那样，先把答案集设置好，再通过对话管理或者检索等模块选到合适的答案返回给用户。

生成式聊天机器人需采取不同的技术思路，在接收到用户输入句子后，采用一定技术手段自动生成一句话作为回答，生成式聊天机器人的好处是可以覆盖任意话题的用户问句，缺点是生成的回答质量很可能会存在问题，比如可能存在语句不通顺存在句法错误等看上去比较低级的错误。

2 seq2seq框架

基于深度学习的聊天机器人技术，总体而言，绝大多数都是基于Encoder-Decoder（或者称作是Sequence to Sequence）框架，这个框架是非常简单而且可扩展的。

该框架可以看作是一种文本处理领域的研究模式，应用场景非常的广泛，不仅仅可以用在聊天机器人领域，还可以应用在机器翻译、文本摘要、句法分析等各种场合。下图是文本处理领域里常用的Encoder-Decoder框架一种抽象表示：

具体到我们聊天机器人的情况，非常简单的系统生成答案的过程由如下两步构成：

1.Encoder对用户输入querry进行编码，生成语义编码c；

2.Decoder对语义编码c进行解码，得到答案Response返回给用户。

3 Attention机制的引入

因为RNN模型对于自然语言这种线性序列来说是最常用的深度学习模型，因而在实际实现聊天系统中，一般Encoder和Decoder都采用RNN系列的模型，其中最常用的是LSTM以及GRU模型，对于长序列的情形，LSTM和GRU模型效果会明显优于传统RNN模型。尽管如此，当句子长度超过30以后，LSTM模型的效果会急剧下降。

基于此，seq2seq框架中开始引入attention机制，用来实现输出Y和输入X句子单词之间的对齐，能够明显提升系统对于长序列的处理能力。

如上图所示，展示了attention机制实现的细节，其实现共分为如下的几步：

1.Encoder编码输入序列，得到对应的表征h =[h1,h2,...,hT]=A(X1,X2,...,XT)

2.解码器输出目标yt之前，会结合将上一步的隐藏状态St-1和Encoder编码得到的表征[h1,h2,...,hT]进行运算，得到一个向量e=[e_t_1, e_t_2,..., e_t_T]，它表征的是在当前的解码时刻，h1,h2,...,hT这T个隐藏状态分别应该输入到解码器的权重。e = G(St-1, h)

3.将向量e进行归一化，得到向量a，即a=[a_t_1, a_t_2,..., a_t_T] = softmax(e)

4.加权求和，获得t解码时刻的语义编码，Ct = a_t_1*h1+a_t_2*h2+...+a_t_T*hT

5.进行t时刻的解码，St = F(St-1, Ct )

总结以下上面的步骤，attention机制其实就是在解码的时候，根据当前的解码状态（上一时刻的解码隐藏状态St-1）来获得当前时刻的语义编码向量Ct。这样，在当前的解码时刻就能够取到当前所需要的语义编码，提高系统的解码能力。

4 多轮会话的探索

基于上述seq2seq框架，聊天机器人可以根据用户当前输入，自动生成回答，形成了一个有效的对话系统。但是一般人们聊天并不是单纯的一问一答，在回答对方的时候，到底说什么，常常要参考上下文。所谓对话上下文，就是在用户当前输入问句Querry之前两者的对话信息。因为存在多轮的一问一答，这种情形一般称为多轮会话。在多轮会话中，一般将上下文称作Context，当前输入称为Querry，回答用Response表示。

深度学习解决多轮会话的关键是如何将上下文聊天信息Context引入到Encoder-Decoder模型中去的问题。一般来说，上下文聊天信息Context都是加入到Encoder中，因为这是除了当前输入Querry外的额外信息。增加编码信息，有助于Decoder生成更好的Response内容。

目前大部分的方案都是这样的思路，区别在于如何将Context信息在Encoder端建立模型或者说具体的融入模型的方式。

下面介绍一个典型的例子，让读者理解这种方式。

如上图所示，是一种层级神经网络（Hierarchical Neural Network，简称HNN）。HNN本质上也是Encoder-Decoder框架，主要区别在于Encoder采用了二级结构。其编码过程由如下几个步骤组成：

1.用“句子RNN(Sentence RNN)”对每个单词进行编码形成每个句子的中间表示；

2.第二级的RNN则将第一级句子RNN的中间表示结果按照上下文中句子出现先后顺序序列进行编码，这级RNN模型可被称作“上下文RNN（Context RNN）”，其尾节点处隐层节点状态信息就是所有上下文Context以及当前输入Querry的语义编码；

3.根据S1，S2，S3，M以及当前输入Querry的语义编码解码出当前的输出，得到response。

总的来说，目前多轮对话的优化都是基于如何在Encoder端编码进更多的Context信息。

关于多轮对话，如需更多学习，可参考如下的文献：

[1] Oriol Vinyals and Quoc Le. 2015. A neural conversational model. In Proc. of ICML Deep Learning Workshop.

[2] Alessandro Sordoni, Michel Galley,Michael Auli, ChrisBrockett, Yangfeng Ji, Meg Mitchell, Jian-Yun Nie,JianfengGao, and Bill Dolan. 2015. A neural network approach to context-sensitivegeneration of conversational responses. In Proc. of NAACL-HLT.

[3] Iulian V Serban, Alessandro Sordoni,Yoshua Bengio,Aaron Courville, and Joelle Pineau. 2015. Building end-to-enddialogue systems using generative hierarchical neural network models. In Proc.of AAAI.

总结

生成式的聊天机器人技术框架非常简洁，在构建过程是端到端（End-to-End）的，数据驱动的，只要给定训练数据即可训练出效果还不错的聊天系统，省去了很多特征抽取以及各种复杂中间步骤的处理，比如省去句法分析与语义分析等传统NLP绕不开的工作，使得系统开发效率大幅提高；同时，增加训练数据也能持续提升系统效果。

但目前该技术仍处于发展初期。不管是技术手段也好，亦或是实际系统效果也好，都有非常大的进步空间。

我们在知识星球实现了一个完整的生成式聊天机器人，感兴趣的同学可以扫描下面的二维码了解。

不会写春联？今年试试这三个AI工具吧

盼望着,盼望着,春节就要来了!今年春节有什么值得期待的事情么?不如趁着爸妈还没来得及催婚催生之前,先好好在家里表现一番. 比如给家里写写春联,或者再原创定制几个送给亲友,这里有三个机器人,能够帮你对对 ...
深度学习基础 | Seq2seq Attention

深度学习基础 | Seq2seq Attention
四万字全面详解 | 深度学习中的注意力机制（二）

目前深度学习中热点之一就是注意力机制(Attention Mechanisms).Attention源于人类视觉系统,当人类观察外界事物的时候,一般不会把事物当成一个整体去看,往往倾向于根据需要选择性 ...
以自注意力机制破局Transformer

各位好久不见,这段时间因工作项目加上家中大事,停更一段时间,细节略过不表. 本文针对Transformer进行重新梳理,针对其中要点附图详细讲解,按需取用! 1. Transformer架构解析首先 ...
(12条消息) 一文读懂BERT(原理篇)

一文读懂BERT(原理篇) 2018年的10月11日,Google发布的论文<Pre-training of Deep Bidirectional Transformers for Langua ...
OCR文字识别—基于CTC/Attention/ACE的三大解码算法

本文全面梳理一下OCR文字识别三种解码算法,先介绍一下什么是OCR文字识别,然后介绍一下常用的特征提取方法CRNN,最后介绍3种常用的解码算法CTC/Attention/ACE. 什么是OCR文字识别 ...
重磅|一文彻底读懂智能对话系统！当前研究综述和未来趋势

选择"星标"公众号重磅干货,第一时间送达! 笔者在最近的研究中发现了一篇非常好的有关对话系统的论文,<A Survey on Dialogue Systems:Recent ...
DeepProg：一个基于多模态转换器的端到端疾病预后预测框架

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
HOTR：基于Transformer的端到端人机交互检测

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
端到端多模态理解的MDETR调制检测

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
Wormhole – 只需要 2 步，简单、私密（端到端加密）的文件传输工具[Web]

在线应用 2021/04/16 青小蛙 5 (8票) Wormhole 是一款简单.私密的文件传输工具,端到端加密,只需要在浏览器打开页面后,选中文件,即可获得分享链接,通过 WebRTC 及服务器中 ...
【罗小布问道】新思维可以创造新广电（74）——《你作为一个负责人的创新者，应该具备端到端的导演能力》...

有线的创新经常是"马路警察,各管一段",要么老死不相往来,要么相互推诿.市场创新者,不考虑技术:实现不了,都是技术人员的错.技术创新者,不考虑市场,技术没有市场,全部都是市场人员的 ...
安卓端苹果端电脑端三者兼有，洛雪音乐助手：永久免费的良心神器！

嘿!持续更新19天,离持续更新目标300天,还有281天. 好多人加了我之后,就问收费吗?我说不收费的模式,当然也会有一点点要求而已,但对于你来说不是门槛. 持续分享出你需要的有价值的东西,也算是一种 ...
联通+腾讯倾力打造国内首款手游端到端加速产品！VIP专用通道吃鸡从此不再卡！

联通+腾讯倾力合作! 国内首款! 移动网络端到端游戏加速产品! 游戏发烧友的最强福音! 亲测有效,欢迎体验! 还不知道<腾讯手游加速器>? 那你可太OUT啦! 小编跟你普及一下它的强大威力 ...
深度 | 马士基：转向端到端数字化物流公司

重要提示:通过本订阅号发布的观点和信息仅供中信建投证券股份有限公司(下称"中信建投")客户中符合<证券期货投资者适当性管理办法>规定的机构类专业投资者参考.因本订阅号暂 ...
近10亿打造的高端学校，生均建筑面积45m²，冠绝全市！

HUALANG 深圳市华朗学校近几年深圳民办学校圈"风起云涌" 每一所新学校都用高标准.高起点.高配置吸引众多家长不过要数最舍得花钱.最肯下重本的学校之一还得是今天 ...

【NLP-ChatBot】能闲聊的端到端生成型聊天机器人背后都有哪些技术？

相关推荐