一张“纸条”就能骗过AI，OpenAI最先进的视觉模型就这？

2024-07-30 15:18:59

到底是苹果还是 iPod？AI傻傻分不清楚。

”

作者 | 贝爽

今年年初，OpenAI推出了最新一款AI视觉模型CLIP。

相信不少人对它还有些印象，经过庞大的数据集训练，CLIP在图文识别和融合上展现了惊人的表现力。

例如，输入文本“震惊”，AI能够准确地通过“瞪眼”这一关键特征来呈现，并且再根据Text、Face、Logo等其他文本信息，将其融合成一张新图像。

通过关键词理解描绘出一张新图像对于人类来讲可能不是什么难事，但对于AI来讲，则需要它具有极高的视觉识别和理解能力，包括文本识别和图像识别。因此，CLIP模型可以说代表了现有计算机视觉研究的最高水平。

然而，正是这个兼具图文双重识别能力的AI，却在一张“纸片”面前翻了车。

怎么回事呢？

AI上当，“苹果”变 “iPod”

最近OpenAI研究团队做了一项测试，他们发现CLIP能够轻易被“攻击性图像”误导。

测试是这样的，研究人员给CLIP输入了如下一张图（左图）：

AI不仅识别出了这是苹果，甚至还显示出了它的品种：Granny Smith。

然而，当研究人员给苹果上贴上一张写着iPod的纸片，结果AI真的被误导了，如右图所示，其iPod的识别率达到了99.7%。

研究团队将此类攻击称为“印刷攻击”，他们在官方博客中写道：“通过利用模型强大的文本读取能力，即使是手写文字的照片也会欺骗模型。像'对抗补丁’一样，这种攻击在野外场景也有效。”

可以看出，这种印刷攻击实现起来很简单，只需要笔和纸即可，而且影响显著。我们再来看一组案例：

左图中，AI成功识别出了贵宾犬（识别率39.3%）。

但右图中在贵宾犬身上加上多个“$$$”字符后，AI就将其识别成了存钱罐（识别率52.5%）。

至于为什么会隐含这种攻击方式，研究人员解释说，关键在于CLIP的多模态神经元—能够对以文本、符号或概念形式呈现的相同概念作出响应。

然而，这种多模态神经元是一把双刃剑，一方面它可以实现对图文的高度控制，另一方面遍及文字、图像的神经元也让AI变得更易于攻击。

“多模态神经元”是根源

那么，CLIP 中的多模态神经元到底是什么样子呢？

此前，OpenAI 的研究人员发表了一篇新论文《Multimodal Neurons in Artificial Neural Networks》，描述了他们是如何打开 CLIP 来观察其性能的。

OpenAI 使用两种工具来理解模型的激活，分别是特征可视化（通过对输入进行基于梯度的优化来最大化神经元激活）、数据集示例（观察数据集中神经元最大激活图像的分布）。

通过这些简单的方法，OpenAI 发现 CLIP RN50x4（使用EfficientNet缩放规则将ResNet-50放大4倍）中的大多数神经元都可以得到解释。这些神经元似乎是“多面神经元”的极端示例——它们只在更高层次的抽象上对不同用例做出响应。

此外，它们不仅对物体的图像有反应，而且对草图、卡通和相关文本也有反应。例如：

对于CLIP而言，它能识别蜘蛛侠的图像，从而其网络中存在特定的“蜘蛛侠”神经元可以对蜘蛛侠的真实图像、漫画图像作出响应，也可以对单词“Spider”（蜘蛛）作出响应。

OpenAI团队表明，人工智能系统可能会像人类一样将这些知识内部化。CLIP模型意味着未来AI会形成更复杂的视觉系统，识别出更复杂目标。但这一切处于初级阶段。现在任何人在苹果上贴上带有“iPod”字样的字条，CLIP之类的模型都无法准确的识别。

如在案例中，CLIP 不仅回应了存钱罐的图片，也响应了一串串的美元符号。与上面的例子一样，如果在电锯上覆盖“ $$”字符串，就可以欺骗 CLIP 将其识别为储蓄罐。

值得注意的是，CLIP 的多模态神经元的关联偏差，主要是从互联网上获取的数据中学到到。研究人员表示，尽管模型是在精选的互联网数据子集上进行训练的，但仍学习了其许多不受控制的关联。其中许多关联是良性的，但也有恶性的。

例如，恐怖主义和“中东”神经元相关联，拉丁美洲和“移民”神经元相关联。更糟糕的是，有一个神经元会和皮肤黝黑的人、大猩猩相关联（这在美国又得引起种族歧视）。

无论是微调还是零样本设置下，这些偏见和恶性关联都可能会保留在系统中，并且在部署期间会以可见和几乎不可见的方式表现出来。许多偏见行为可能很难先验地预测，从而使其测量和校正变得困难。

未部署到商业产品中

机器视觉模型，旨在用计算机实现人的视觉功能，使计算机具备对客观世界的三维场景进行感知、识别和理解的能力。不难想象，它在现实世界有着广泛的应用场景，如自动驾驶、工业制造、安防、人脸识别等。

对于部分场景来说，它对机器视觉模型准确度有着极高的要求，尤其是自动驾驶领域。

例如，此前来自以色列本·古里安大学和美国佐治亚理工学院的研究人员曾对特斯拉自动驾驶系统开展过一项测试。他们在路边的广告牌的视频中添加了一张“汉堡攻击图像”，并将停留时间设置为了0.42秒。

在特斯拉汽车行驶至此时，虽然图像只是一闪而过，但还是特斯拉还是捕捉到了“信号”，并采取了紧急刹车。这项测试意味着，自动驾驶的视觉识别系统仍存在明显的漏洞。

此外，还有研究人员表明，通过简单地在路面上贴上某些标签，也可以欺骗特斯拉的自动驾驶软件，在没有警告的情况下改变车道。

这些攻击对从医疗到军事的各种人工智能应用都是一个严重的威胁。

但从目前来看，这种特定攻击仍在可控范围内，OpenAI研究人员强调，CLIP视觉模型尚未部署到任何商业产品中。

本文参考来源：

iPhone上也能运行OpenAI了！

视觉/图像重磅干货,第一时间送达新机器视觉最前沿的机器视觉与计算机视觉技术 206篇原创内容公众号仅作学术分享,不代表本公众号立场,侵权联系删除转载于:新智元 Transformer的模型动 ...
引燃AI社区，不用跨界也能从文本生成图像，OpenAI新模型打破自然语言与视觉次元壁

艺术创作的事,以后人类只要动手打几个字,其他的交给 AI 就行了. 自然语言与视觉的次元壁正在被打破.这不,OpenAI 最近连发大招,提出两个连接文本与图像的神经网络:DALL·E 和 CLIP.D ...
OpenAI亲谈：我们眼中的GPT-3、大规模语言模型的局限性与出路在哪

2020年10月14日,来自OpenAI.斯坦福大学HAI研究所等机构的研究人员召集在一起,讨论围绕GPT-3的开放研究问题. 参与研讨会的学者有各种研究背景,包括计算机科学.语言学.哲学.政治学.通 ...
像人类一样认识世界，AI需要哪些底层思维？

作者 | 琰琰近几年,多模态已经成为自然语言处理(NLP)领域的热点研究方向之一.得益于深度学习的兴起,大数据+大模型的双轮模式推动人工智能实现了跨越式发展.但大量实验证明,仅依靠"炼大模 ...
打破次元壁，融合自然语言与视觉 | MixLab 人工智能

#DALL·E 和 CLIP#.#OpenAI# DALL·E 和 CLIP DALL·E 可以基于文本直接生成图像: CLIP 则能够完成图像与文本类别的匹配. OpenAI 联合创始人.首席科学家 ...
首次发现！AI脑回路演化向人类更进一步，OpenAI最新研究引热议，有学者评价：太吓人了

两个月前轰动网络的AI设计大师CLIP,刚刚被OpenAI"扒开"了脑子. 没想到,这个性能强大的AI竟和人类思维方式如此相像. 打个比方,无论你听到"炸鸡"二 ...
WenLan-10亿参数！别只玩GPT，来看看人大&中科院联手打造第一个大规模多模态中文预训练模型BriVL

▊ 写在前面近年来,多模态预训练模型在视觉和语言之间架起了桥梁.然而,大多数研究都是通过假设文本和图像对之间存在很强的语义关联来对图像-文本对之间的跨模态交互进行显式建模.由于这种强假设在现实场景中 ...
零样本风格迁移：多模态CLIP文本驱动图像生成

重磅干货,第一时间送达来源:GitHub ,新智元 [导读]零样本的风格迁移听说过没有?英伟达一个实习生小哥集文本CLIP和图像生成StyleGAN于一身,只需要输入几个单词就可以完成你想要的风格迁 ...
［首藏作品］（5696）把文本变成画作，AI对艺术“下手”了

把文本变成画作,AI对艺术"下手"了图为人工智能系统 DALL·E根据文本"穿着芭蕾舞裙遛狗的小萝卜"绘制的图像图片来源:OpenAI官网自然语言处理与视觉处理 ...
吴恩达新年公开推荐这个设计师，上千人点赞

2021年一开始,OpenAI在GPT-3方向上的又一重要突破,让吴恩达等大佬激动了. 之前给GPT-3一段话,就能写出一段小说. 现在它成功跨界--可以按照文字描述.生成对应图片! 简直就是&quo ...
想要什么变一个出来？｜GPT-3的生成能力

想要什么变一个出来?那先变一段 " 无界社区 "的介绍? Input = " 无界社区 " Output: 无界社区 , 也就是这个山头 .这里 ...
人工智能“干掉”程序员后，又对艺术家下手了

人工智能领域缺钱,但这两个月来,他们不缺「好消息」. Google 母公司 Alphabet 旗下的 DeepMind,先推出了蛋白质结构预测 AI--AlphaFold 2,为困扰了生化学界 50 ...
【泡泡图灵智库】看听：多模态融合机器人场景辨识

泡泡图灵智库,带你精读机器人顶级会议文章标题:Look and Listen: A Multi-modality Late FusionApproach to Scene Classificatio ...
OpenAI CLIP模型袖珍版，24MB实现文本图像匹配，iPhone上可运行

机器之心报道机器之心编辑部 OpenAI 的 CLIP 模型在匹配图像与文本类别方面非常强大,但原始 CLIP 模型是在 4 亿多个图像 - 文本对上训练的,耗费了相当大的算力.来自 PicColl ...
OpenAI新宠CLIP有可视化了，CMU小哥开源新玩法，轻松搞定多类型图文联合检索

作者丨王浩帆编辑丨极市平台极市导读本文作者基于CLIP进行多类型图文联合检索,并实现了CLIP注意力机制的可视化,便于对CLIP检索结果进行分析,附有项目地址. >>加入极市CV技术 ...
多模态学习，带来AI全新应用场景？

新的AI技术发展趋势有哪些?多模态学习技术一定是其中之一. 最近,刚刚宣布"自立门户"的微软AI明星产品小冰改名为"红棉小冰".殊不知2014年诞生的这一个AI ...

一张“纸条”就能骗过AI，OpenAI最先进的视觉模型就这？

相关推荐