AI的“眼睛”不好使

2024-05-07 01:17:13

将一辆黄色出租车和一副双筒望远镜区别开是很容易的，大多数人哪怕倒立时都能做到这一点。但对于人工智能（AI）可不是这样：把出租车翻过来，它就会将之认作双筒望远镜。

这只是美国人工智能专家阮安收集到的几十个例子中的一个，这些例子表明AI识别物体的本领比我们想象的要差远了。这让我们对AI在某些领域的应用（如无人驾驶汽车）更加谨慎。

人类是如何识别图像的？

图像识别是人工智能的一个重要领域。对于人来说，识别图像并不是一件难事。我们通常是依靠图像本身所具有的特征来将它们识别出来的。每个图像都有它的特征，如字母A有个尖，P有个圈，而Y的中心有个锐角等。研究表明，当我们识别一个图像时，视线总是集中在图像的主要特征上，也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方——这些地方的信息量最大。如果图像有多个特征，眼睛的扫描路线也总是依次从一个特征转到另一个特征上。

由此可见，在我们识别图像的过程中，知觉必须排除多余的输入信息,只抽取出关键的信息。然后将这些关键信息进行分门别类，存储在记忆中。当下次遇到类似图像时，将陌生图像中的关键信息提取出来，与存储在记忆中的信息进行比较，从而将其识别出来。依据这种办法，我们不仅能识别某个具体的字母A,也能识别印刷体的、手写体的、方向不正的（甚至倒立过来）、大小不同的各种字母A。

AI产生错觉的原因

但是，当前的AI图像识别技术还远远达不到人类的水平。它们更多地依赖模式识别。

所谓模式识别，就是说识别某个图像，必须在过去的经验中有这个图像的记忆模式（又叫模板）。当前的图像如果能与记忆中的模板相匹配，这个图像就能被识别。例如有一个字母A，如果在记忆中有个A模板，字母A的大小、方位、形状都与这个A模板完全一致，字母A就被识别了。这种方法强调图像必须与记忆中的模板完全符合才能加以识别。

这就怪不得AI经常会被人为篡改的图片迷惑。比如，将图片上的一只乌龟配上特殊的外壳之后，并不影响人类的基本判断，但AI却很容易将其误认为是一把枪。

然而，这还好说。这些图像毕竟是专门设计用来迷惑AI的，它们在现实中不太可能存在，现在问题严重的是，你几乎不需要专为AI篡改一个图象，就足以引起它混乱。

阮安和他的同事从一个用来训练AI的数据库中选择了一些常见物体的图像，然后随机旋转并改变物体在图片中的位置。他们发现，这足以难倒目前世界上最先进的几个图像识别系统，所有系统平均97%的时间里都识别错了。在一个案例中，原始图像是一辆校车，所有图像识别系统能正确识别。但是，把图像特写放大之后，却被它们误认为是一只口袋；当图像被倒置着立在道路上时，又被它们误认作是一辆铲雪机。

这是因为AI的图像识别本领是通过大数据训练出来的，但当初接受训练的时候，在海量的图片里，物体很少有倒立或放大的。

让AI向人类靠齐

这种状况向我们提出了一个重要问题：使用AI是否安全？

比如在战场或者地震现场，你希望图像识别系统能从多个不同角度识别物体。同样，基于AI的机场安检扫描仪也需要能够从多个角度识别行李中的物体。

对于无人驾驶汽车，这个问题尤其关键。对一辆车来说，当遇到一个不能识别的物体，避开就行了。但是，假如把前方路上的一个可乐罐误认作消防车而紧急刹车，那就很危险。

遗憾的是，迄今没有人知道该如何解决这些问题。最大的障碍是，当AI看到一个图像时，它还无法抽取出有关该对象的关键信息，或者分不清什么是关键信息，什么是次要信息。

所以，为了达到人类的推理水平，我们还需要赋予AI一种能从图像中抽取关键信息的本领。

【AI-1000问】机器学习和模式识别是什么关系？

你能区分机器学习和模式识别吗? 当今要是说起人工智能,聊起AI,每个人或多或少都能说出一点,从历史到未来,从图灵到冯诺依曼,从SVM到CNN等等,但是如果问你是否知道机器学习和模式识别有什么区别?我相 ...
背诵手册 | 第一编普通心理学14-17

背诵手册 | 第一编普通心理学14-17
仅用40张图片就能训练视觉模型：CVPR 2019伯克利新论文说了什么？

在工业界的热情参与下,AI行业大会近年来的发展可谓是如火如荼.不过,依然很少有哪个能比得上CVPR在计算机视觉领域的影响力.其中, 又以oral口头报道的文章最具重量级. 那么在CVPR 2019中, ...
AI人工智能时代，如何保证信息安全？

在AI人工智能时代,人脸识别功能是得到广泛使用的,同时这对于每个人来说都并不陌生.但是随着人脸识别技术的普遍应用,带来的风险也随之而来.那么AI人工智能时代,如何保证信息安全? 人脸识别,通常也称人像 ...
it技术改造方案模板

嘉宾 | 向宇波编辑 | suiling 来源 | AI科技大本营在线公开课出品 | AI科技大本营(ID:rgznai100) 随着行业的发展和技术的成熟,文字识别(OCR)目前已经应用到了多个 ...
回归原理，更少的努力，更多的收获

在前文快速学会任何东西的四个步骤中,我们说第一步是解构,先将技能分解为最基本单元.比如学中文,汉字不是最小的单元,偏旁部首才是. 如果你正在学英语,就自然会问,英语中有没有类似于偏旁部首,组成单词的基 ...
这些名垂青史的画家「眼睛都不好使」| Dr.Why

眼睛对于我们每一个普通人来说都尤为重要,更不要说那些需要发现美的艺术家了. 可是艺术家也是人,我们普通人可能会得的眼疾,艺术家们也一样逃不掉,比如散光.近视.青光眼.白内障.色盲等等. 那么,如果艺术 ...
《三千鸦杀》开播槽点多，服化道辣眼睛，AI换脸成亮点

3月19日,根据同名小说改编的电视剧<三千鸦杀>开播. 这个不大不小的IP还挺受关注,刚开播就上了热搜.然而尴尬的是,在某平台统计的播放热度排行上,数到20位都看不到<三千鸦杀> ...
用眼睛探索身体的秘密，飞利浦能用AI做到什么程度？

从照明设备起家至产线覆盖手机.电视.医疗保健等领域,飞利浦用了100年时间:但将逐渐冗杂的业务收紧,进而针对性发展,聚焦其优势所在,它只用了十余年. 自2014年起,飞利浦更加聚焦健康科技领域.这一年 ...
对眼睛好使的传统方法（转载）

几年前,洒家因某种缘分,遇到一位老隐士.他告诉我,他岁数大了的时候,眼睛又近视.又花眼.他师傅,告诉他一个办法:双盘打坐,闭目"看"两个涌泉穴. 结果,这位老兄,苦炼双盘腿,甚 ...
［首藏作品］（5328）奔跑吧，让AI做你的眼睛

奔跑吧,让AI做你的眼睛人工智能助盲打开视障人士新视野本报记者华凌"我们应该激励更多为视障人士创新的技术成果,让其尽早转化成真正让视障人士受益的产品,这需要构建一个良好的创新生态.&qu ...
AI分析过往十年人气动漫角色：下巴越来越尖，眼睛越来越大

现在AI技术真的越来越发达,看动漫的时候,经常就能看到一些个"高科技AI"类的角色,那颜值那智商,比现实中很多人都要高. 不过,现实中的AI技术目前主要还是运用在分析方面,海量的数 ...
西城店 | 眼睛不好了，吃“猪肝”好使么？

原创健管中心西城店北京厚朴中医 _________ 眼睛出了问题怎么办,吃猪肝吗? 这个问题,有一个标准的厚朴答案"不一定" 从中医角度来看,眼睛的问题不仅是肝的问题,与全身的经 ...
AI科技让阅读更科学

pingpu
孙国荣：为什么眼睛近视的孩子越来越多？

有些父母对于孩子近视的问题也是特别着急,孩子眼睛近视怎么办?尝试去给孩子配眼镜,换眼镜,但这只是外在的调理,随着时间的增长,近视的度数还会一直上涨,所以这也是家长比较担心和关心的问题.对此,苏州国医堂 ...

AI的“眼睛”不好使

相关推荐