陈根：人工智能的语言学习之路，从挑战到突破

2024-08-05 23:39:26

文/陈根

语言作为人们与生俱来的能力，能帮助人们传递很多重要的信息。正因为人类独特的语言能力，人类才具有特殊性。这也是人工智能至今仍在艰难突破的技术桎梏。

究其原因，世界上有千万种不同的语言和方言，既有共通之处，又各自独立不同。此外，每个词汇和句子还会给人一种语义，而这个语义对每个人的反馈又各不相同。语言的复杂性给机器学习带来了挑战。

比如，那么对于同一个语义，不同语言和方言对应反馈都可能有差异，甚至对于不同环境成长的同一语言人群以及同一个人在不同年龄段和不同情绪状态下的反馈都可能不同。

近日，斯坦福大学人工智能实验室（SAIL）发表博客，介绍了其两篇 ACL 2020 论文。这两项研究立足于近段时间 BERT 等神经语言模型的突破性成果，指出了一个颇具潜力的新方向：使用语言解释来辅助学习 NLP 乃至计算机视觉领域的任务。

简单来说，就是针对自然语言处理（NLP）和计算机视觉领域的多种高难度任务，他们首先用语言解释这些任务，然后使用深度神经网络模型来学习这些语言解释，进而帮助解决这些任务。

事实上，BERT 等现代深度神经语言模型已经显现出解决多项语言理解任务的潜力。因此，SAIL 在这两篇论文中提出使用神经语言模型来缓解这些基本问题。这些神经语言模型或以确定相关领域内语言解释为目标，或使用了可以解读语言解释的通用型“知识”来进行预训练。

第一篇论文研究了如何使用语言解释来构建文本分类器，即使用自然语言解释来帮助解决单个任务。基于此，研究人员提出了 ExpBERT 模型，其使用了针对文本蕴涵任务训练的 BERT 模型，BERT 在这一过程中输出的特征可替代上述语义解析器提供的指示特征。

第二篇论文提出一种名为语言塑造型学习（Language Shaped Learning/LSL）的方法，即在训练时使用语言解释，则可以促使模型学习不仅对分类有用的表征，而且该表征还能用于预测语言解释。

语言之精妙彰显了人类之精巧，人工智能想要克服语言的技术桎梏依然还有漫长的路要走，但研究已在路上。在人工智能获得语言能力前，社会也将对其技术进行谨慎的设计，这也是科技时代下必然要面对的问题。

常用预训练语言模型（PTMs）总结

NLP工作站 16篇原创内容公众号从以下5个部分通过QA的方式进行总结:Transformer架构.Transformer-Encoder预训练语言模型.Transformer-Decoder预训 ...
深度学习领域，你心目中 idea 最惊艳的论文是哪篇？

前2个是NLP领域的基础工作,早已"走向世界",在CV,ASR中有了广泛应用.后3个基于前两项工作进行了创新和推广,在语义解析子任务Text2SQL上大放光彩. 提出Transfo ...
【NLP】深入浅出解析BERT原理及其表征的内容

本篇介绍目前NLP领域里影响力最大的预训练模型BERT.首先,大致介绍了BERT里有什么:接着,介绍了BERT的结构和其预训练的方式:最后,再总结BERT的表征的内容和分布. 作者&编辑 | ...
论文解读：Bert原理深入浅出

Bert 自 Google 于 2018 年发表至今,一直给人们带来惊喜,期间也陆陆续续因为Bert出现的原因多了不少新的岗位,甚至公司 JD 上都明确表明必须懂 Bert. 它在 11 项自然语言处 ...
NLP 高引论文解读两篇 | BERT模型、SQuAD数据集

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 作者: Jacob Devlin, M ...
谈谈文本匹配和多轮检索

作者:朱帅学校:华中科技大学研究方向:文本匹配,对话系统 1. 关于文本匹配文本匹配是NLP的基础任务之一,按照论文中的实验对传统的文本匹配任务进行分类,大致可以分为文本检索(ad-hoc),释 ...
ENRIE：知识图谱与BERT相结合，为语言模型赋能助力

来自:朴素人工智能感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理,我们将沿此脉络前行,探索预训练语言模型的前沿技术,红框中为已介绍的文章,绿框中为本期介绍的模型,欢迎大家留言讨论交流. E ...
哈工大刘挺：如何训练一个更强大的中文语言模型？

自从Google提出预训练语言模型BERT,关于语言模型的玩法层出不穷. 然而,大部分模型都是在英文场景中提出的,迁移到中文场景效果往往有不同程度的下降. 之前我和朋友参加了CCKS机器阅读理解比赛, ...
陈根：跨越十年溯源路，自然环境首现超级真菌

文/陈根 2009年,东京一家医院发现了一种此前从未出现的真菌病原体,它对大多数已知的抗生素具有抗药性,这就是一度令人们感到恐慌的耳念珠菌(Candida auris).因其具有多重耐药和致死率高的特 ...
陈根：微球阳极锂电池，实现容量三倍突破

文/陈根锂离子电池的应用范围仍在不断扩大,包括为从智能手机.笔记本电脑到电动汽车的一切提供动力,而所有这些,都是通过使用石墨作为阳极来实现的--设备的负极.但与此同时,锂电池容量也仍受到主要负极材料 ...
陈根：关闭驱动癌症生长基因，挑战癌症治疗

文/陈根近日.范德比尔特大学的研究人员称,他们发现了如何有效地关闭驱动癌症生长的基因. 该基因被称为MYC,一直以来,癌蛋白转录因子MYC都是恶性肿瘤的主要驱动因素,也是开发抗癌疗法的高度验证但具有 ...
文/陈根机器学习是人工智能的一个重要分支，而深度学习则是机器学习发展到一定阶段的必然产物。深度学习就像生物神经大脑的工作机理一样，通过合适的矩阵数量，多层组织链接一起，形成神经网络“大脑”进行精准复

文/陈根机器学习是人工智能的一个重要分支,而深度学习则是机器学习发展到一定阶段的必然产物. 深度学习就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络"大脑 ...
陈根：人工智能——处理语言的机器

文/陈根 20世纪50年代,图灵提出著名的"图灵测试",引出了自然语言处理的思想,而后,经过半个多世纪的跌宕起伏,历经专家规则系统.统计机器学习.深度学习等一系列基础技术体系的迭代 ...
陈根：32种语言可翻译，人工智能追赶翻译需求

文/陈根利用计算机把一种自然语言转变成另一种自然语言的过程就是机器翻译. 机器翻译对于信息时代下海量信息的捕获无疑具有重要作用,事实上,人们对于机器翻译的需求也与日俱增.除了专业的出版水平的翻译,机 ...
陈根：人工智能助力医疗，追溯癌症起源

文/陈根人工智能在医疗卫生领域广泛应用正形成全球共识.可以说,人工智能以独特的方式捍卫着人类健康福祉,除了在诊疗手术.就医管理.医疗保险发挥作用,基于算法的人工智能近年来更是推动着疾病诊断与药物研究 ...
陈根：人工智能，助力T细胞标靶预测

文/陈根特异性免疫(specific immunity)又称获得性免疫或适应性免疫,它是由人体经后天感染(病愈或无症状的感染)或人工预防接种(菌苗.疫苗.类毒素.免疫球蛋白等)之后,而使机体获得的一 ...
陈根：用人工智能，解决“声子态密度”

文/陈根人工智能.大数据.量子力学以及超级计算的结合,加深了人们对材料的理解,并且使人们不再只是依赖人类直觉去发现新材料. 事实上,过往的重大材料的发现都是科学家偶然间或者多次试验得到的.例如,人们 ...

陈根：人工智能的语言学习之路，从挑战到突破

相关推荐