AI的“眼睛”不好使

将一辆黄色出租车和一副双筒望远镜区别开是很容易的,大多数人哪怕倒立时都能做到这一点。但对于人工智能(AI)可不是这样:把出租车翻过来,它就会将之认作双筒望远镜。

这只是美国人工智能专家阮安收集到的几十个例子中的一个,这些例子表明AI识别物体的本领比我们想象的要差远了。这让我们对AI在某些领域的应用(如无人驾驶汽车)更加谨慎。

人类是如何识别图像的?

图像识别是人工智能的一个重要领域。对于人来说,识别图像并不是一件难事。我们通常是依靠图像本身所具有的特征来将它们识别出来的。每个图像都有它的特征,如字母A有个尖,P有个圈,而Y的中心有个锐角等。研究表明,当我们识别一个图像时,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方——这些地方的信息量最大。如果图像有多个特征,眼睛的扫描路线也总是依次从一个特征转到另一个特征上。

由此可见,在我们识别图像的过程中,知觉必须排除多余的输入信息,只抽取出关键的信息。然后将这些关键信息进行分门别类,存储在记忆中。当下次遇到类似图像时,将陌生图像中的关键信息提取出来,与存储在记忆中的信息进行比较,从而将其识别出来。依据这种办法,我们不仅能识别某个具体的字母A,也能识别印刷体的、手写体的、方向不正的(甚至倒立过来)、大小不同的各种字母A。

AI产生错觉的原因

但是,当前的AI图像识别技术还远远达不到人类的水平。它们更多地依赖模式识别。

所谓模式识别,就是说识别某个图像,必须在过去的经验中有这个图像的记忆模式(又叫模板)。当前的图像如果能与记忆中的模板相匹配,这个图像就能被识别。例如有一个字母A,如果在记忆中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这种方法强调图像必须与记忆中的模板完全符合才能加以识别。

这就怪不得AI经常会被人为篡改的图片迷惑。比如,将图片上的一只乌龟配上特殊的外壳之后,并不影响人类的基本判断,但AI却很容易将其误认为是一把枪。

然而,这还好说。这些图像毕竟是专门设计用来迷惑AI的,它们在现实中不太可能存在,现在问题严重的是,你几乎不需要专为AI篡改一个图象,就足以引起它混乱。

阮安和他的同事从一个用来训练AI的数据库中选择了一些常见物体的图像,然后随机旋转并改变物体在图片中的位置。他们发现,这足以难倒目前世界上最先进的几个图像识别系统,所有系统平均97%的时间里都识别错了。在一个案例中,原始图像是一辆校车,所有图像识别系统能正确识别。但是,把图像特写放大之后,却被它们误认为是一只口袋;当图像被倒置着立在道路上时,又被它们误认作是一辆铲雪机。

这是因为AI的图像识别本领是通过大数据训练出来的,但当初接受训练的时候,在海量的图片里,物体很少有倒立或放大的。

让AI向人类靠齐

这种状况向我们提出了一个重要问题:使用AI是否安全?

比如在战场或者地震现场,你希望图像识别系统能从多个不同角度识别物体。同样,基于AI的机场安检扫描仪也需要能够从多个角度识别行李中的物体。

对于无人驾驶汽车,这个问题尤其关键。对一辆车来说,当遇到一个不能识别的物体,避开就行了。但是,假如把前方路上的一个可乐罐误认作消防车而紧急刹车,那就很危险。

遗憾的是,迄今没有人知道该如何解决这些问题。最大的障碍是,当AI看到一个图像时,它还无法抽取出有关该对象的关键信息,或者分不清什么是关键信息,什么是次要信息。

所以,为了达到人类的推理水平,我们还需要赋予AI一种能从图像中抽取关键信息的本领。

(0)

相关推荐

  • it技术改造方案模板

    嘉宾 | 向宇波 编辑 | suiling 来源 | AI科技大本营在线公开课 出品 | AI科技大本营(ID:rgznai100) 随着行业的发展和技术的成熟,文字识别(OCR)目前已经应用到了多个 ...

  • 回归原理,更少的努力,更多的收获

    在前文快速学会任何东西的四个步骤中,我们说第一步是解构,先将技能分解为最基本单元.比如学中文,汉字不是最小的单元,偏旁部首才是. 如果你正在学英语,就自然会问,英语中有没有类似于偏旁部首,组成单词的基 ...

  • 背诵手册 | 第一编 普通心理学14-17

    背诵手册 | 第一编 普通心理学14-17

  • 【AI-1000问】机器学习和模式识别是什么关系?

    你能区分机器学习和模式识别吗? 当今要是说起人工智能,聊起AI,每个人或多或少都能说出一点,从历史到未来,从图灵到冯诺依曼,从SVM到CNN等等,但是如果问你是否知道机器学习和模式识别有什么区别?我相 ...

  • 仅用40张图片就能训练视觉模型:CVPR 2019伯克利新论文说了什么?

    在工业界的热情参与下,AI行业大会近年来的发展可谓是如火如荼.不过,依然很少有哪个能比得上CVPR在计算机视觉领域的影响力.其中, 又以oral口头报道的文章最具重量级. 那么在CVPR 2019中, ...

  • AI人工智能时代,如何保证信息安全?

    在AI人工智能时代,人脸识别功能是得到广泛使用的,同时这对于每个人来说都并不陌生.但是随着人脸识别技术的普遍应用,带来的风险也随之而来.那么AI人工智能时代,如何保证信息安全? 人脸识别,通常也称人像 ...

  • 这些名垂青史的画家「眼睛都不好使」| Dr.Why

    眼睛对于我们每一个普通人来说都尤为重要,更不要说那些需要发现美的艺术家了. 可是艺术家也是人,我们普通人可能会得的眼疾,艺术家们也一样逃不掉,比如散光.近视.青光眼.白内障.色盲等等. 那么,如果艺术 ...

  • 《三千鸦杀》开播槽点多,服化道辣眼睛,AI换脸成亮点

    3月19日,根据同名小说改编的电视剧<三千鸦杀>开播. 这个不大不小的IP还挺受关注,刚开播就上了热搜.然而尴尬的是,在某平台统计的播放热度排行上,数到20位都看不到<三千鸦杀> ...

  • 用眼睛探索身体的秘密,飞利浦能用AI做到什么程度?

    从照明设备起家至产线覆盖手机.电视.医疗保健等领域,飞利浦用了100年时间:但将逐渐冗杂的业务收紧,进而针对性发展,聚焦其优势所在,它只用了十余年. 自2014年起,飞利浦更加聚焦健康科技领域.这一年 ...

  • 对眼睛好使的传统方法(转载)

    几年前,洒家因某种缘分,遇到一位老隐士.他告诉我,他岁数大了的时候,眼睛又近视.又花眼.他师傅,告诉他一个办法:双盘打坐,闭目"看"两个涌泉穴.   结果,这位老兄,苦炼双盘腿,甚 ...

  • [首藏作品](5328)奔跑吧,让AI做你的眼睛

    奔跑吧,让AI做你的眼睛人工智能助盲打开视障人士新视野本报记者 华 凌"我们应该激励更多为视障人士创新的技术成果,让其尽早转化成真正让视障人士受益的产品,这需要构建一个良好的创新生态.&qu ...

  • AI分析过往十年人气动漫角色:下巴越来越尖,眼睛越来越大

    现在AI技术真的越来越发达,看动漫的时候,经常就能看到一些个"高科技AI"类的角色,那颜值那智商,比现实中很多人都要高. 不过,现实中的AI技术目前主要还是运用在分析方面,海量的数 ...

  • 西城店 | 眼睛不好了,吃“猪肝”好使么?

    原创健管中心西城店 北京厚朴中医 _________ 眼睛出了问题怎么办,吃猪肝吗? 这个问题,有一个标准的厚朴答案"不一定" 从中医角度来看,眼睛的问题不仅是肝的问题,与全身的经 ...

  • 孙国荣:为什么眼睛近视的孩子越来越多?

    有些父母对于孩子近视的问题也是特别着急,孩子眼睛近视怎么办?尝试去给孩子配眼镜,换眼镜,但这只是外在的调理,随着时间的增长,近视的度数还会一直上涨,所以这也是家长比较担心和关心的问题.对此,苏州国医堂 ...