【EMNLP2020】“自言自语”来实现无监督常识问答

2024-08-04 08:32:14

Paper: Unsupervised Commonsense Question Answering with Self-Talk
Link: arxiv.org/pdf/2004.0548

NLP中的很多任务都需要引入背景知识，也就是一些基本常识，去年EMNLP主会上的一篇文章提出一个新方法来引入commonsense——‘self-talk’，简单来说就是提出问题回答问题。模型本身并不复杂，在结果上和之前的baseline相比稍好一些，但也不是碾压式超越。不过这篇文章重点在于提出了一个新的思路，一个更符合人类思考方式的思路。

目前主流的方法是预训练语言模型和引入知识库，这篇文章中作者提出了一个无监督模型，用一个LM（language model）给答案打分，以及一个LM作为知识源。整个过程是基于提问的发现学习。我们来看下图中的例子，这个问题是，因为Brett在大学期间找了份实习然而Ian没有，所以谁在毕业后更慢找到了实习。（这是个选择题，选项是Brett和Ian）。

1）作者对于不同的QA任务提前整理了question prefix，如图中的‘What is the purpose of’

2）然后对于每个prefix使用Nucleus采样生成五个问题，一个问题最长是6个token，例如图中生成的’What is the purpose of internship？’

3）接下来对每一个问题生成多个答案，每一个question prefix都对应一个answer prefix，例如‘What is the purpose of’ 对应’The purpose of is’, 结合文本，第二步得到的问题和answer prefix得到十个答案。

在得到背景知识后，背景知识和文本加起来（如下图）一起预测答案，损失函数最小的就是被选中的答案。

下图是实验结果，一共是在六个benchmark上进行评测，标注颜色部分是作者的实验结果部分，除了上述的方法，作者一开始还介绍了LM baseline和external knowledge baseline，self-talk是针对这两个baseline的一个融合和改进。

以上是这篇论文的主体内容了，这篇长论文在后面还探讨了有用的clarification和不利的clarification，有兴趣的朋友可以仔细去看看~

赞 (0)

NTU Machine Learning 2020 hw3 CNN的做法

利用VGGnet来完成Image Classification,在Kaggle勉强过了Strong Baseline... 首先感谢一下NTU的李宏毅老师分享这么好的课程,还把作业也给分享了出来作业 ...
2021517【每日刷题】不积跬步，无以至千里！

题目公共管理常识 1. [单选]按决策者所处管理层次的不同,经营决策可分为三项,其中不包括( ). A. 基层决策 B. 中层决策 C. 高层决策 D. 计量决策 2. [单选]事业单位受聘人员连 ...
ML之catboost：catboost模型中常用的Pool类型数据结构源代码解读、案例应用之详细攻略

ML之catboost:catboost模型中常用的Pool类型数据结构源代码解读.案例应用之详细攻略 catboost模型中常用的Pool类型数据源结构代码解读 Pool简介 Pool 是在CatB ...
轻量高效！清华智能计算实验室开源基于PyTorch的视频 (图片) 去模糊框架SimDeblur

作者丨科技猛兽编辑丨极市平台极市导读清华大学自动化系智能计算实验室团队开源基于 PyTorch 的视频 (图片) 去模糊框架 SimDeblur,涵盖经典的视频 (图像) 去模糊算法且轻量高效. ...
【泡泡一分钟】无监督几何感知深度激光雷达里程计

每天一分钟,带你读遍机器人顶级会议文章标题:Unsupervised Geometry-Aware Deep LiDAR Odometry 作者:Younggun Cho, Giseop Kim a ...
FAIR最新无监督研究：视频的无监督时空表征学习

设为星标,干货直达! 机器学习算法工程师机器学习.深度学习.数据挖掘等人工智能领域的技术实战干货文章,这里都有!分享从业经验是我们的不变的准则-- 567篇原创内容公众号近期,FAIR的Kaim ...
人生基因体系养生保健技能常识问答

姓名: 性别: 手机: 籍贯: 一.以人为本,落实到人人家家.具体到每家每户和工作生活实地一一对应方位.其中 ...
基于深度学习的无监督磁共振图像去噪方法

MRI图像是一种以不同灰度显示不同结构的解剖和病理的断面图像,广泛应用于疾病的检测.诊断以及治疗监测.然而,MRI图像的成像过程往往伴随着随机噪声,这导致了低质MRI图像的产生.MRI图像的质量不仅会 ...
FAIR提出Barlow Twins：最简单的无监督学习方法

设为星标,干货直达! AI编辑:我是小将本文作者:王珣 https://zhuanlan.zhihu.com/p/355523266 本文已由原作者授权转载从Kaiming的MoCo和Hinton ...
古典诗歌常识问答（一）

⒈什么是灵感? 答:灵感是在文艺.科学活动中,由于有关事物的启发而突然产生的富有创造性的思路,是对作品的构思突然颖悟时所显现出的一种思维高度集中.情绪高度兴奋的心理状态. ⒉诗的灵感有哪几个基本特点? ...
H-Net：基于无监督注意的立体深度估计

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
DeepfakeUCL：基于无监督对比学习的深度假检测

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
极市沙龙回顾｜CVPR2021-戴志港：UP-DETR，针对目标检测的无监督预训练Transformer

作者丨戴志港编辑丨极市平台上周六,由极市平台与中国图象图形学学会联合举办的第三期极市CV开发者沙龙活动圆满结束. 本次线下沙龙的主题为CVPR2021论文研讨会.我们邀请了三位CVPR2021接收 ...