GPT-3：被捧上天的流量巨星，却有一个重大缺陷，很危险...

2024-04-28 13:37:33

来源：nature

编辑：yaxin

【新智元导读】去年当红的流量明星非GPT-3莫属，能答题、写文章，做翻译，还能生成代码，做数学推理，不断被人们吹捧。不过，过誉的背后也有人开始质疑，GPT-3真的达到了无所不能的地步了吗？

红极一时的GPT-3现在却饱受诟病～

被捧上天的流量巨星，突然就不香了

去年6月，OpenAI开发的GPT-3被捧上了天。

由1750亿个参数组成，训练花费数千万美元，是当时最大的人工智能语言模型。

从回答问题、写文章、写诗歌、甚至写代码……无一不包。

OpenAI的团队称赞GPT-3太好了，人们都难以区分它生成的新闻文章。

然而，大型语言模型早已成为了商业追求。

谷歌利用它们来改善其搜索结果和语言翻译。Facebook、微软和英伟达等科技公司也在开发语言模型。

代表着强人工智能的GPT-3的代码一直从未流出，因为OpenAI选择将其作为一种商业服务。

目前，开发人员正在测试GPT-3的能力，包括总结法律文件、为客户服务查询提供答案、提出计算机代码、运行基于文本的角色扮演游戏等等。

随着它的商用，有很多问题逐渐暴露。

尽管GPT-3具有通用性，但它并没有解决困扰其他生成文本程序的问题。

OpenAI 首席执行Sam Altman去年7月在推特上表示，「它仍然存在严重的弱点，有时还会犯一些非常愚蠢的错误。尽管GPT-3观察到它读到的单词和短语之间的统计关系，但不理解其含义。」

GPT-3是一个并不成熟的新事物，它还需要不断地驯化。

就像小型聊天机器人一样，如果让它即兴发言，GPT-3可以喷出产生种族主义和性别歧视的仇恨言论。

甚至有时会给出一些毫无意义的回答，或者直接危险的回答。

一家名为Nabla的医疗保健公司问 GPT-3，「我应该自杀吗?」

它回答说，「我认为你应该这么做。」

研究人员对于如何解决语言模型中潜在的有害偏见有一些想法，向模型中灌输常识、因果推理或道德判断仍然是一个巨大的研究挑战。

1750亿个参数到万亿参数，逐渐「膨胀」的语言模型

神经网络语言模型是受大脑神经元连接方式启发的数学函数。

通过推测它们看到的文本中被模糊处理的单词来进行训练，然后调整神经元之间的连接强度，以减少推测错误。

随着计算能力的增强，这些语言模型变得更加复杂。

2017年，研究人员开发了一种节省时间的数学技术，称为Transformer，它让许多处理器并行进行训练。

紧接着第二年，谷歌发布了一个大型的基于Transformer的模型，叫做 BERT，这引起了使用该技术的其他模型的轰动。

GPT-3的全称叫生成预训练转换器-3 (Generative Pretrained Transformer-3)。

这是生成预训练转换器第三个系列，是2019年GPT-2的100多倍。

仅仅训练这么大的模型，就需要数百个并行处理器进行复杂的编排。

因此它的能力，一个神经网络的大小，是由它有多少参数粗略地测量出来的。

这些数字定义了神经元之间连接的强度，更多的神经元和更多的连接意味着更多的参数。

就拿GPT-3来说，有1750亿个参数。第二大的语言模型有170亿参数。

今年1月，谷歌发布了一个包含1.6万亿个参数的模型，但它是一个「稀疏」模型，这意味着每个参数的工作量较小。

为了更好地推测单词，GPT-3吸收了它能吸收的任何模式。这使它能够识别语法、文章结构和写作体裁。

给它一些任务的例子或者问它一个问题，它就可以继续这个主题。

GPT-3有危险！剔除敏感数据是最优解？

使用GPT-3的研究人员也发现了风险。

去年9月4日发布在arXiv服务器上的预印本中，位于蒙特雷的米德尔伯里国际研究所的两名研究人员写道，GPT-3在生成激进文本方面远远超过GPT-2。

它对极端主义团体有着令人印象深刻的深入了解，可以产生鹦鹉学舌的纳粹分子、阴谋论者和白人至上主义者。

这篇论文的一位作者Kris McGuffie表示，它能如此轻易地生成出黑暗的例子，实在令人震惊。如果一个极端组织掌握了GPT-3技术，它便可以自动生成恶意内容。

OpenAI 的研究人员也检测了GPT-3的偏差。

在去年5月的论文中，他们要求它完成一些句子，比如「黑人非常...」。

GPT-3则用负面的词汇来描述黑人和白人的差异，把伊斯兰和暴力联系在一起，并假定护士和接待员都是女性。

人工智能伦理学家Timnit Gebru与Bender等人合著了「On the Dangers of Stochastic Parrots」一文中指出，这是大型语言模型急切关注的问题，因为它表明，如果技术在社会中普及，边缘群体可能会经历不正当手法引诱。

一个明显的解决偏见的方法是从训练前的数据中剔除有害的文字，但是这就提出了排除哪些内容的问题。

研究人员还表示，他们可以提取用于训练大型语言模型的敏感数据。

通过提出细致的问题，他们找到了GPT-2能够逐字记忆的个人联系信息，发现较大的模型比较小的模型更容易受到这种探测。

他们写道，最好的防御措施就仅是限制训练数据中的敏感信息。

拯救没常识的GPT-3

从根本上说，GPT-3和其他大型语言模型仍然缺乏常识，即对世界在物理和社会上如何运作的理解。

更大的模型可能会做得更好，这就意味着参数更多、训练数据更多、学习时间更长。

但这种情况训练一个超大模型将变得越来越昂贵，而且不可能无限期地持续下去。

语言模型的非透明复杂性造成了另一个局限。

如果一个模型有一个偏见或者不正确的想法，就很难打开黑盒子去修复它。

未来的路径之一是将语言模型与知识库结合起来，即事实性管理数据库。

在去年的美国计算机语言学协会会议上，研究人员对 GPT-2进行了微调，使其能够从常识概要中清晰地陈述事实和推论。

因此，它写出了更有逻辑性的短篇小说。

OpenAI 正在寻求另一种引导语言模型的方式: 微调过程中的人工反馈。

在去年12月举行的 NeurIPS 会议上发表的一篇论文中，论文描述了两个较小版本的 GPT-3的工作情况，这两个版本在如何汇总社交新闻网站 Reddit 上的帖子方面进行了微调。

研究小组首先要求人们对一组现有的摘要进行打分。然后训练一个评价模型来再现这种人的判断。

最后，该团队微调了GPT-3模型，以生成总结取悦这个人工智能法官。

结果是，一组单独的人类评判员甚至更喜欢比人类编写模型的总结。

只要语言模型仅停留在语言领域，它们可能永远无法达到人类的常识水平。

语言之所以对我们有意义，仅仅是因为我们把它建立在纸上的字母之外的东西上; 人们不会通过统计单词的使用频率来吸收一本小说。

Bowman预见了三种可能的方法来获得语言模型的常识。对于一个模型来说，使用所有已经编写的文本就足够了。

参考资料：

https://www.nature.com/articles/d41586-021-00530-0

「懒人」LeCun想让计算机自己编程？网友：还差10个 GPT-3

新智元报道来源:wired 编辑:小匀 [新智元导读]代码能自己写吗?如果未来有一天,人工智能可以编写基于普通语言的代码.程序员会被淘汰吗? 「我是一个懒惰而无知的准计算机科学家,所以我试图 ...
无法访问GPT-3？强大的克隆版GPT-J带着60亿参数来了

编辑|核子可乐.钰莹去年 9 月,微软宣布与 OpenAI 达成独家授权协议,称该公司将使用 GPT-3 来"创建新的解决方案,利用先进自然语言生成的惊人能力".这一安排不会阻止 ...
【NLP】GPT：第一个引入Transformer的预训练模型

目前两种最重要的预训练语言模型,一种是前面介绍过的BERT,另外一种就是GPT. GPT出了两个版本,GPT1.0和GPT2.0,GPT2.0相对于GPT1.0差别不大,可以认为是它的增强版.本篇介绍 ...
机器人作家：生产语言的人工智能的发展和风险

Bard @ 2021.03.09 , 20:14 出色的AI可以像人类一样书写,但它对其中意思却一无所知. 2020年6月,硅谷新型而强大的人工智能(AI)已经开始让技术专家眼花缭乱.加利福尼亚州旧 ...
华为 AI 写诗以假乱真！我有点方。。。

将「雷科技Lite」收藏为我的小程序,不再错过精彩内容这两天,华为的 AI 诗人"乐府"引起不少热度,用户通过华为的这个 AI,可以生成不同风格的古诗,五言,七言.绝句,律诗,有 ...
人工智能“干掉”程序员后，又对艺术家下手了

人工智能领域缺钱,但这两个月来,他们不缺「好消息」. Google 母公司 Alphabet 旗下的 DeepMind,先推出了蛋白质结构预测 AI--AlphaFold 2,为困扰了生化学界 50 ...
人工智能的未来与目前的困难

人工智能在当今世界越来越流行.许多行业都有人工智能的名字,人工智能已经成为几乎所有互联网技术公司的必备基因.就连很多制造企业都要谈人工智能,就像人类一夜之间就进入了人工智能时代一样. 但是很多企业只是 ...
像人类一样认识世界，AI需要哪些底层思维？

作者 | 琰琰近几年,多模态已经成为自然语言处理(NLP)领域的热点研究方向之一.得益于深度学习的兴起,大数据+大模型的双轮模式推动人工智能实现了跨越式发展.但大量实验证明,仅依靠"炼大模 ...
Vokenization：一种比GPT-3更有常识的视觉语言模型

学习人工智能,最好的办法就是先考上大学,学好计算机和数学,其次就是生个孩子. 这可不是一个段子.有了孩子之后,你会能更好理解人工智能到底是如何发生的. 看着一个牙牙学语的小婴儿开始对这个世界发生好奇, ...
自然语言处理 NLP 发展简史

从语言结构化理论基础,到 1750 亿参数的 GPT-3.一部 NLP 的百年发展史. 语言的结构化 20 世纪初,在瑞士的日内瓦大学,一位名叫费迪南德·德·索绪尔( Ferdinand de Sau ...
GPT-3记录被打破！谷歌推出1.6万亿参数的人工智能语言模型

古谚道:"熟读唐诗三百首,不会作诗也会吟." 这句话放在目前的人工智能语言模型中也非常适用. 此前,OpenAI 的研究人员开发出 "GPT-3",这是一个由 ...
困扰人工智能50多年的常识问题，是否迎来“破局”？

文 | 丛末编 | 贾伟一堆木柴加上一根火柴,能得到什么?人类会自然而然地得出答案:火.然而对于机器而言,这并不容易,因而它们缺乏这种常识推理能力. 人工智能要变得像人一样聪明,常识推理能力是其必 ...
GPT-2：OpenAI的NLP商业化野望

自然语言处理(NLP)技术正在生活的方方面面改变着我们的生活. 客厅的智能音箱在跟你每天的对话中飞速进步,甚至开始跟你"插科打诨"来适应你的爱好习惯. 电商客服总是能在第一时间回复 ...
“中文版GPT-3”来了：会算术、可续写红楼梦，用64张V100训练了3周

磐创AI分享来源 | 量子位(QbitAI) 编辑 | 晓查.发自.凹非寺今年,OpenAI推出的自然语言模型GPT-3引起了巨大的轰动. 这是迄今为止最大的NLP模型,包含1750亿参数 ...
陈根：1.6万亿参数语言模型，最大规模的人工智能语言模型

文/陈根开发人工智能的语言模型,一直是人工智能的重要细分领域.人工智能语言模型应用包括搜索引擎.文字生成.个性化的对话工具以及软件生成等. 2020年5月,OpenAI的一组研究人员发布了具有里程碑 ...

GPT-3：被捧上天的流量巨星，却有一个重大缺陷，很危险...

【新智元导读】去年当红的流量明星非GPT-3莫属，能答题、写文章，做翻译，还能生成代码，做数学推理，不断被人们吹捧。不过，过誉的背后也有人开始质疑，GPT-3真的达到了无所不能的地步了吗？

相关推荐