有研究表明,更大的脑电α功率(8-13Hz)是更有创造力的个人和任务的特征。本研究调查了机器学习对不同大脑状态的创造性高低进行分类的潜力。受试者完成了一项“替代用途任务”,在这项任务中,他们需要想出日常物品(如砖头)的常规或非常规(更具创造性)用途。本研究假设,对于非常规用途,α功率会更大,机器学习(ML)方法将能够从这两种情况中获得可靠的分类数据。此外,还预计ML会成功地对个体的创造性高低进行分类。正如预期的那样,非常规情况下的α功率明显大于常规情况下的α功率。本研究使用频谱加权的共同空间模式提取脑电特征,并进行二次判别分析,发现这两种情况的分类准确率在个体间差异很大,平均为63.9%。对于创造力较强的个体,分类准确率达到82.3%。这些发现表明机器学习在创造力研究中广泛应用的潜力。
人们对EEG用于评估创造性认知的兴趣和利用的增加很大程度上要归功于其优异的时间分辨率,这使得事件相关电位(ERPs)的研究以及瞬时网络连贯性和锁相活动成为可能。发散思维(DT)任务是检验创造性想法产生的一种常见方法,评估DT的一种标准方法是替代用途任务(AUT)。在AUT中,受试者被要求为常见物体(如砖)构思新的用途,他们的回答通常根据流畅性和原创性进行评分。基于EEG的研究大多一致地表明,AUT任务中更好的表现与α波段活动的增强有关。此外,在AUT中,更有创造力的人比创造力较差的人表现出更高的α功率。α功率和创造力之间的关系被认为与对外部刺激的关注的减少和对内部导向的关注的增多有关,当注意力更关注外部时,α功率会减少。本研究每个实验包括四个阶段:1)参考阶段:向受试者呈现一个注视十字;2)准备阶段:受试者看到一个提示,表明当前实验所需的用途类型(常规或非常规);3)想法生成阶段:显示物品的名称,直到受试者表示已经想好了回答;4)响应阶段:受试者输入他们的回答。据预测,ML的使用将能够可靠地对多波段脑电数据进行分类。除了各种ML参数的操纵之外,还出于减轻计算压力的目的,探索了基于先验的通道选择。30例健康人参与本研究,其中男性8例,女性21例,平均年龄19.55岁,SD=1.99。一名受试者因为没有正确遵循任务说明而被排除在所有数据分析之外。所有受试者的视力都是正常的或矫正到正常的,没有被诊断出患有任何精神障碍。研究得到了当地机构审查委员会的批准,所有受试者都给予书面知情同意。AUT被用来衡量创造性想法的产生。在这项任务中,向受试者受试者展示30种不同的常见物品。这30个物品中随机依次在两种情况(常规或非常规)中的某一情况下呈现,然后30个物品被再次呈现,但情况与先前相反。在常规情况下,受试者被指示想出常规的、原始的方法来使用这些物品;在非常规情况下,他们被指示想出非常规的、创造性的方式来使用这些物品。
AUT以呈现固定十字开始。随后出现一个提示词(“常规”或“非常规”),显示5秒。接着是一个物体的名称,显示30秒。受试者按下电脑键盘上的回车键作为回应,调出一个白色文本框以供键入。受试者输入他们的回答,然后再次按回车键来记录答案,然后进入下一次试验(如图1)。
为了检验创造力的个体差异,并进行基于分数的创造力分类分析,5名不了解研究条件和研究目的的独立评委对所有关于创造力的回答进行了评级,评分从1(最不具创造力)到10(最具创造力)。根据评分结果,选出排名靠前和排名靠后的9名受试者,形成两组(高创造力和低创造力)。脑电信号采集采用BioSemi ActiveTwo系统,32个头皮电极和4个EOG AG/AgCl电极按10/20系统定位。使用BioSemi ActiveTwo生物电位测量系统和ActiView软件在2048 Hz记录EEG数据。在记录过程中,信号以0.16 Hz的频率进行高通滤波。情况类型(常规或非常规)和创造性高低的ML分类分析是本研究的重点。本研究还使用处理后的数据进行了聚焦于8-30 Hz频率范围的条件间频谱分析。在两种情况下,研究了脑电数据选择的下列方面的变化:电极位置/通道、时间窗口、频率范围。所有信号处理在MATLAB R2018b中的EEGLAB和BCILAB工具箱进行,使用IBM SPSS进行了其他统计分析。脑电信号经过1 Hz的高通滤波和58 Hz的低通滤波。伪子空间重建用于识别和拒绝伪影原理组件。ASR使用滑动窗口(0.5s,50%重叠)来移除瞬时的高振幅伪影(例如眨眼、肌肉抽搐等)。进行了独立成分分析。多重伪影排除算法(MARA)被用来识别和删除较坏的独立分量(IC),该算法从时间域(1.平均局部偏斜度)、空间域(2.模式内范围,3.电流密度范数)和频谱域(4.对数α功率,5.λ和6.拟合误差)域提取6个特征。使用EEGLAB进行统计比较。为了找到最佳的分类精度,系统地测试了头皮上不同数量和不同位置的通道组合。其中包括全头皮组合(全部32个皮层通道)和单独的P4。在所有情况下,组合都包括P4(右顶叶),因为该区域参与创造性思维。与P4结合的其他单个通道的位置为Fz、F3、F7、Cz、C3、Pz、P3、P7、T7,以及每个非中线(z)通道对应的对侧通道。与P4结合的通道组合如下:(2个附加通道)F3/F7(左额)、F3/C3(左额中)、C3/P3(左中顶)、C3/T7(左中颞),以及每个通道对应的对侧对;(3个附加通道)C3/C4/P3(双侧中顶)和P3/P7/P8(双侧顶);(4个附加通道)F3/F4/F7/F8(双侧额)、F3/F4/C3/C4(双侧额中)。选择这些通道组合是为了提供对皮层区域的良好覆盖,这些区域要么被观察到对常规和非常规的AUT情况的需求有不同的反应,要么在创造性思维的早期阶段有反应。使用频谱加权共同空间模式(SpecCSP)算法的3次迭代来提取EEG特征。感兴趣的初始频带是θ(4-8 Hz)、低α(8-10 Hz)、高α(10-13 Hz)、β(13-30 Hz)和γ(30-42 Hz),后来为了提高分类性能而排除了θ和γ。因此,结果仅限于来自低α、高α和β波段的数据。最小相位滤波器频率规格在低端设置为6 Hz,在高端设置为44 Hz。SpecCSP模式的数量被设置为不大于为给定数据集选择的通道的数量,即2个通道/2个CSP模式(否则会发生错误)。为了减少计算量,根据奈奎斯特定理,在此阶段将数据下采样至100 Hz。使用的监督分类算法有二次判别分析(QDA)和支持向量机(SVM)。然而,QDA在本研究中的表现一直优于SVM,因此结果仅说明QDA。对于这两种分类器类型,使用10折交叉验证性能估计程序,对SpecCSP导出的特征进行预测模型训练。在任务期间,通过呈现将标志常规和非常规思维周期开始的不同事件代码添加到数据流中,这些被用作目标标记(分类器)。组和个人水平的表现评估是根据分类准确率来描述的,分类准确率由真/假阳性率和阴性率确定。受试者在常规情况下的反应速度快于非常规情况下的反应速度。采用配对t检验检验EEGLAB的条件间对数变换功率谱密度(PSD)。对于非常规的情况,功率在F4的多个频率范围内显著大于正常情况(如图2)。这包括分别低和高α频段(8.6-10 Hz和10-11.5 Hz)的连续范围。在17.5至27.6 Hz的β频段的许多范围内,非常规的功率也更大。在非常规的情况下,P4的功率也更大。与F4很相似,虽然在更大的频段上,P4的功率在12.9-20.1 Hz和28 Hz的β频段的许多范围内都更大 (图2)。
图2 两种情况下F4和P4电极位置的频谱功率密度的比较。底部的地形图(所有通道)分别显示了两种情况下10 Hz(α)的功率。分类精度通常与所包括的通道数量成反比关系。当将通道数限制在右额叶(F4)和右顶叶(P4)时,准确率最高。分别使用原始信号和处理后的数据对个体受试者的QDA条件分类的10折交叉验证进行评估。对于原始数据,个体准确率为36.7%~93.3%,平均为63.9%(SD=0.15)。对于处理后的数据,个体准确率为39%~95%,平均为62.7%(SD=0.15)。原始数据和处理后的数据分别用于训练和评估模型。基于分数的(AUT任务评级)对创造力较强和创造力较差的个体的分类只使用非常规情况下的原始数据和清理数据,从而将快速反应的影响降至最低。使用所有受试者的原始数据,QDA的情况分类准确率为59.7%(如图3)。此外,当QDA导出的模型根据所有受试者的原始数据进行训练,然后将该模型应用于个体时,分类准确率在40%到85%之间,平均为59.2%(SD=0.12)。使用所有受试者的处理数据的准确性略低于原始数据。QDA的情况分类准确率为57.5%,当对每个个体应用基于所有受试者的处理数据训练的QDA派生模型时,预测准确率在47.4%~88.3%之间,平均为58.5%(SD=0.13)。
图3 谱加权共同空间模式(Spec-CSP)在高创造性组和低创造性组(上)以及整个组条件分类分析(下)中的发现。对于原始数据分类,高创造性组的准确率为56.3%。增加折叠次数会略微降低精确度,降至56.1%。低创意组的准确率稍好一些,分别为58.1%和59.2%。对于处理数据分类,高创造性组的准确率为54.9%。增加折叠数可将准确率提高到56%。低创造性组数据的条件分类准确率稍高,为56.9%。增加折叠数可将准确率提高到58.5%。对于原始数据,组间创造力分类为82.3%。将折叠次数增加到25次会降低准确性(81.2%)对于处理后的数据,组间的分类为81.3%(如图3)。将折叠次数增加到25次降低了准确率(80.7%)。
4.讨论
与常规情况相比,创造性思维开始时的非常规的情况下,右侧额叶和顶叶α频段的功率更大。除了结果中报告的1-2.5s的主要周期外,一般分析策略还包括测试AUT任务期间的其他几个潜伏期。1-2.5s产生了最高的分类准确性,表明α能力在试验的创造性思维阶段开始时增加,然后下降。就分类精度而言,考虑到个体在处理风格、任务重点和其他变量上的差异可变性,个体模型通常比群体模型工作得更好。模型准确率最高的受试者在两个电极位置(F4/P4)的α和β波段也比那些模型精度较低的受试者显示出更大的功率。高精度组和低精度组在右侧额叶和顶叶区域的最显著差异存在于低α和高α范围内。这种差异的原因还不太清楚,尽管有一种趋势是创造力分数越高,分类准确率越高。在原始数据中,创造力较强和创造力较差的受试者被成功分类的比率略高于82%。具体地说,有可能使用从具有高度创造性的个人派生的模型来向训练范式中的其他受试者提供实时反馈。然而,考虑到个性化分类的优异表现,对这一性质的期望应该是适度的。在这一领域继续研究的一个更可能的好处是,通过使用数据驱动的ML分析,对创造性思维有了更丰富的理解。最后,观察到对原始数据进行分类所产生的准确率基本上等同于使用经过处理的数据所获得的准确率,这突显了在不需要超高性能设备的情况下成功地实时对EEG数据进行分类的可能性。总而言之,ML在创造力研究中的潜在价值实际上是一种尚未开发的资源,其应用可以远远扩展到以EEG为重点的研究之外。例如,未来的研究可以检验自然语言处理是否可以用来对书面或口头创造性任务的反应进行一致、客观的评估,或者图像处理ML是否可以对绘画进行同样的评估。当然,ML还可以应用于其他生理指标。事实上,ML已经被用来基于fMRI数据进行预测,甚至是预测基因与大脑的相互作用,这两者都与创造力的研究相关。考虑到ML的日益普遍及其在许多科学研究分支中的成功实施,更广泛地采用ML很可能会对创造力研究领域产生良好的影响。