陈根:人工智能表情识别,人与人的表情有否不同?
文/陈根
尽管人类的悲欢并不相同相通,但人类的面部表情却可以超越地域和文化。
近日,来自加州大学伯克利分校和谷歌的研究人员使用机器学习和 YouTube视频,对常见的面部表情和引发表情的情境进行了比较。结果发现,无论是在生日聚会上,还是在肃穆的葬礼上,又或者是抗议活动中,人类都在不同的社会情境中使用相同的面部表情,比如微笑、皱眉、鬼脸和愁眉苦脸。
这项研究结果发表在12月16日的《自然》杂志上,证实了人类情感表达跨越地域和文化边界的普遍性。也就是说,人类丰富的面部表情可以超越地域和文化。
根据论文,研究人员利用被称为“深度神经网络”(deep neural network)的机器学习技术,对上传到YouTube上的约600万段视频片段中的面部表情进行了分析,这些视频片段来自北、中、南美洲、非洲、欧洲、中东和亚洲的144个国家。这也是第一次对日常生活中的面部表情运用人工智能技术进行全球分析。
首先,研究人员使用考恩的机器学习算法记录了全球600万个事件和互动的视频片段中显示的面部表情,例如观看烟花、欢乐地跳舞或安慰哭泣的孩子。其中,研究人员开发的在线地图显示了与16种情绪相关的面部表情变化。
随后,研究人员将面部表情与不同世界地区的情景和场景联系起来,发现了跨越地理和文化界限的人们在不同社会背景下使用面部表情的惊人相似之处。
研究人员表示,他们发现面部行为中丰富的细微差别,包括将敬畏、痛苦、胜利和其他13种情感联系在一起的微妙表情,在世界各地类似的社交场合中都有使用。比如,在视频片段中,世界各地的人们在婚礼上表现出满足感,在表演武术时会皱起眉头,对抗议表示怀疑,在摇滚音乐会和竞技体育赛事中举重和获胜时表现出兴奋。
研究结果显示,来自不同文化背景的人在面对不同的社会和情感状况时,有大约70%的面部表情是相同的。
研究人员认为,这支持了达尔文的理论,即在我们的脸上表达情感在人类中是普遍存在的。人们情感的身体表现可能帮助人们提高沟通和合作技能。当然,这项研究结果更可能有助于帮助那些看不懂面部表情的人,比如自闭症患者,识别他人的个人情绪状态。毫无疑问,这个庞大的面部表情数据库将在这些研究中发挥作用。