人类的悲欢虽不相通,但情感分析模型读得懂

内容提要:社交媒体逐渐成为当今人们生活的一部分,而它也成为心理学家们进行研究的重要数据来源。与此同时,研究者也尝试利用自然语言处理、机器学习技术,来预测社交媒体用户的情绪波动。

原创:HyperAI超神经

关键词:自然语言处理 心理学


去年突如其来的新冠疫情,深刻地影响着人们的生活。这一特殊的历史时期,社会大众的心理都变得敏感脆弱。

疫情期间减少外出和接触,使得民众把更多时间花在社交网络上。有些人不可避免地将工作和生活中的不如意,通过网络发泄给了别人。恐慌、焦虑、悲伤、无助等不良情绪也有所加重。

面对突发公共事件,社交媒体用户普遍出现了包括愤怒、害怕、担心、迷惘、悲伤等负面情绪

据调查显示,全球互联网用户平均每天花在社交媒体上的时间,达到 2 小时 22 分钟,社交媒体已经不限于社交功能,它们还成为了很多人记录心情、倾诉心事的阵地。

无论是国内的微信朋友圈、微博、QQ 空间等,还是国外的 Twitter、Instagram、Facebook,都承载了万千用户的状态。

而对于心理学研究者来说,这些社交媒体上的帖子,无疑为其提供了数量可观的研究数据。

来自斯坦福大学的研究员 Johannes Eichstaedt 和密歇根大学的 Aaron Weidman,在其最新研究中,使用自然语言处理工具,对 Facebook 用户的帖子进行分析。

研究表明,机器学习模型可以通过社交媒体洞察一个人的情绪与波动,其准确度与传统心理学的度量结果相当。

从字里行间,读懂你的喜怒哀乐

近年来,网络上的大量资料,已经成为人格科学中一个重要的数据来源。大量的研究表明,使用社交媒体资料,对人格相关维度进行分类十分有效。

Eichstaedt 和 Weidman 的最新研究,则为利用社交媒体大数据分析、跟踪人的心理状态,提供了一个前沿案例。

使用社交媒体语言跟踪心理状态的波动:基于每周情绪波动的案例研究

取样校准

作者使用「效价」和「唤起」这两个基本情绪维度,来评价 Facebook 上帖子的情绪。

注:「效价」和「唤起」是心理学中评价情绪的两个维度,前者表示感受到的积极/消极程度,区分正面和负面情绪;后者表示冷静/兴奋的程度。

他们首先让已经有心理学研究基础的人类研究助理,给一项早期研究中的 2895 条公开 Facebook 帖子做注释。

研究助力给每一条帖子的「效价」(valence)和「唤醒」(arousal)进行打分。采用 9 分制(对于「效价」,1=「消极」,9=「积极」,同样地,对于「唤起」,1=「低」,9=「高」)。

心理学研究助理为帖子所作出的「效价」和「唤起」注释

该情绪跟踪数据集已经公开:https://osf.io/pbjer/files/

完成这些评价之后,这些帖子被用于训练机器学习模型,该模型将能够预测哪种语言传达了哪种情感。

然后作者对这些评分数据进行了一系列模型的拟合,每一个模型都显示,「效价」和「唤起」之间可能存在的明显联系。

对于国内的 NLP 研究者来说,中文情感分析数据集则更为适用。因此,超神经为大家推荐一个来自 2014 NLPCC 的中文微博情感分析数据集。

该评测数据来自新浪微博,对于输入的整条微博,任务要求判断出该微博是否包含情绪。对包含情绪的微博,要求判别其情绪分类输出为 anger(愤怒)、disgust(厌恶)、fear(恐惧)、happiness(高兴)、like(喜好)、sadness(悲伤)、surprise(惊讶)。

数据集详细信息如下:

下载地址:https://hyper.ai/datasets/14390

模型创建

团队使用差异语言分析工具包 DLATK(Differential Language Analysis ToolKit),提取所选 Facebook 帖子中的语言特征,根据单词、短语出现的相对频率,保留了比偶然出现的短语频率高出三倍以上的词汇。最终过滤出 1439 个句子成分用来预测「效价」,675 个句子成分预测「唤起」。

接着,训练一个基于整个语言特征集的脊回归模型,来预测「效价」和「唤起」,并使用 10 倍交叉验证(即在 90% 的数据上建立模型,然后在剩余的 10% 上进行评估)。

该模型的交叉验证样本外预测准确率为:「效价」预测准确率 0.63;「唤起」准确率为 0.82。与之前其他标准的情感测量方法相比较,发现该模型比这些替代测量方法估计得更准确。

验证样本

为了测试该模型,研究团队又从超过 6.5 万条 Facebook 帖子中,抽取了 640 个美国用户,男女人数相当,还需要满足的条件为:至少连续 14 周的时间里,发布 10 条以上的状态。

最终,研究团队收集了这些用户发布的 303575 个帖子作为验证样本。

实验结果

作者对用户的情绪评价进行了可视化,如下图,描述了一个女性(左)和一个男性(右)的每周情绪和唤醒波动,以及五大人格特征预测。

注:五大人格特征是现代心理学中,用于人格特质描述的结构模型。包括:外向性、神经质、亲和性、尽责性和经验开放性。

横坐标为「效价」值,纵坐标为「唤起」值

从图中看到,左边的女性用户情绪波动较大,并且出现高度愉悦(Valence)、高度兴奋(Arousal)的频率较高。

相比之下,右边的男性用户,情绪波动较小,很少经历高度愉悦或高度兴奋的情绪。

这也是团队实验中的一个新发现:女性往往比男性更乐观、情绪变化范围更广。这与

另外,团队分析还发现了「效价」和「唤起」值和五大人格之间的相关性。

模型评估

提供验证样本的 Facebook 用户,之前都自愿参与了「我的性格」的问卷调查,测评了其五大性格特征。

结果显示,机器学习模型对他们性格的预测,与使用心理学调查方法的预测一致。

缺陷分析

当然,作者也指出了这一模型目前所存在的问题。

首先,他们以比较活跃的 Facebook 用户作为样本,但是之所以选择他们是因为他们提供了足够频繁的状态更新,但他们并不可能代表所有美国人。

其次,不同社交平台,具有不同的属性与风格,使用 Facebook 帖子所获得的成果,能否在不同社交媒体 比如 Twitter 上进行复制,还是个未知数。

因此,这些局限性、普适性问题,也都是研究者未来要进一步探索的方向。

社交平台用于心理学,潜力无限

也许对于很多人来说,社交平台无非是一个分享生活、美照、看八卦的地方,但事实上它在心理学研究中拥有着巨大的潜力。

通过数据挖掘、机器学习,能够从巨量的数据中提取信号,识别出患有抑郁症、焦虑症等情绪障碍的人,然后及时采取一些治疗措施。在这方面,国内也已经有成熟案例。

荷兰阿姆斯特丹自由大学(Vrije Universiteit Amsterdam)人工智能学者黄智生,于 2018 年创建了一个叫做「树洞救援队」的 AI 程序,在微博上搜寻有自杀倾向的帖子,然后通过「蛛丝马迹」锁定有轻生念头的用户的位置,及时派出救援志愿者前去寻找和疏导。

现在这支有志愿者组成的小队,还活跃在心理疏导的一线。

截至 2020 年 9 月底,成立两年时间以来「树洞救援队」共阻止了 3289 次自杀行为

另外,基于社交媒体的情感分析技术,还可以追踪创伤性事件(比如大地震、战争、新冠肺炎疫情等),对人们的心理影响,从而帮助政府部门有效开展舆情疏导、科学施救和民众情绪的安抚工作。

而对于个人来说,也许未来可以利用这些工具,分析分析男/女朋友的小情绪呢,大家就再也不用猜来猜去了~

新闻来源:

https://hai.stanford.edu/blog/can-artificial-intelligence-map-our-moods

(0)

相关推荐

  • 307吴聪:积极社交反馈的心理学解析

      一.本质是开启和维持积极性互动 社交反馈指社交时社交对象给予你的反应和表现.在前面一篇文章中我有提到,大学生社交主动性会因为一种主动且有建设性的反馈而提升.而现实是,这种反馈在现实的社交过程中极其 ...

  • 情绪传染席卷社交网络

    你表达在社交网络上的情感 可能会影响其他人的情绪 情绪传染理论在1993年由美国社会心理学家Elaine Hatfield提出.该理论认为,人类存在自发模仿身边人言行.并将它同步为自身行为的习惯. 如 ...

  • EBR: Facebook在向量检索上的探索

    Overall 开始之前,先简单了解下Facebook的搜索业务,如下有三种,用过社交网络的大概都能理解. People Search: 找人 Groups Search: 找组 Events Sea ...

  • 人类的悲欢并不相通

    READ TIME 人类的悲欢并不相通 1 最近听说这么一件真事,一个聪明漂亮又阳光的女孩,所在某个微信群里有个男孩,活跃异常,每天老爱发些有的没的,励志的鸡汤文,并不聪明的俏皮话,并不好笑的小幽默之 ...

  • 人类的悲欢并不相通——读《束星北档案》有感

    最近翻了翻<束星北档案--一个天才物理学家的命运>. 这本书出版于2005年.10年前,束星北经常出现在各类杂志上,所以,关于束星北的故事以及这本书的大概,我七七八八都知道,但一直没有看过 ...

  • 博海拾贝 0403:人类的悲欢并不相通

    [1]鼋头渚樱花 [2]摄像都要被晃倒了 [3]滑板车男终于找到抢镜头的机会了! [4]鞋掉了,这人没了 [5]你这人怎么这样! [6]宝塔肉 [7]成功把两个瓶底的灰尘搓了进去,看起来比右侧多很多呢 ...

  • 贴地飞行 | 人类的悲欢并不相通 我只觉得他们吵闹丨十位著名作家的诗

    安迪 王朔为鲁迅理发 KT板油画 80X100cm 作家的诗 人就无需介绍了,十位作家,如雷贯耳.有几首诗,稍微说明一下,鲁迅这首是他文章中我最喜欢的一段话,被我分了行:张爱玲这首选自她的长篇小说&l ...

  • 鲁迅:人类的悲欢并不相通,我只是觉得他们吵闹

    文:十里 插图:来源于网络 不知道您是否还记得鲁迅说过这样的一句话,那就是"人类的悲欢并不相通,我只是觉得他们吵闹".不难想象,在一个夜深人静的夜晚,鲁迅正在伏案写作,这个时候突然 ...

  • 人类的悲欢并不相通,但对抗抑郁,中医可以帮到你!

    老朋友了,看完记得"三连"哦~ " "大多数人都生活在平静的绝望中.--梭罗" " 一个叫晶晶的女孩,在生日当天,选择从天桥上纵身一跃而下, ...

  • 鲁迅:人类的悲欢并不相通

    后台回复"读书" 文|鲁迅 主播|潮羽 人类像是堆成巨塔的沙,自私的风一吹,也就散了. 与您分享鲁迅的文章:人类的悲欢并不相通. 蜜蜂的刺,一用即丧失了它自己的生命:犬儒的刺,一用 ...

  • 人类的悲欢并不相通,想看你朋友圈的人其实也没几个

    不知从何时起,有些熟悉的面孔,再也没在朋友圈里看到过. 有一位朋友,读书的时候是个心思灵活.热爱旅行的小伙子,经常分享自己拍摄的美景:大漠孤烟的雄浑风沙,江南古镇上的浩渺星河,湘西山麓的神秘雾霭尽收眼 ...

  • 鲁迅先生说“人类的悲欢并不相通”,这就是人性的真相

    历史的长河不断向前推进,但人性却一直留在原地,不曾有丝毫的改变.就如<三国演义>的开场白所写:天下大势,分久必合,合久必分,人心也是随着时代而轮回的.每当外部条件发生变化的时候,人性也会随 ...