Cerebral Cortex:男女性别差异的大脑形态学标记物
1.摘要
许多神经精神疾病(一些出现在青春期)在患病率、发病率和症状上存在性别差异。因此,探究男女发育期间大脑结构的差异,有利于探究关于这些疾病二型性背后的神经机制。利用Adolescent Brain Cognitive Development研究收集的数据,使用线性支持向量机分类器,根据结构脑成像数据的形态计量学和图像强度值来预测性别,探究青少年(9-10岁)男性和女性大脑(n=8325)的差异。分类器对86%的个体进行了正确的性别分类,其中脑岛、中央前回和中央后回以及胼胝体周围沟是最明显的特征。这些结果表明存在复杂但强有力的测量大脑性别差异的形态标志。
2.引言
许多神经精神疾病在患病率、发展轨迹和症状上存在性别差异。如,有研究表明自闭症谱系障碍(ASD)在男性中的患病率明显高于女性。重度抑郁症(MDD)存在相反的模式,女性患病率高于男性。在青春期就观察到,抑郁症患者可能存在性别差异。因此,研究大脑中的性别差异是非常重要的。确定在青春期是否存在生物性别的大脑标志物对理解男女大脑发育差异起重要作用。建立这样一种大脑二型性模式将为我们指出不同特征的可能来源,并促进对这些二型性大脑结构功能的进一步理解。
单变量分析已经证明了整体形态差异,如男性和女性的颅内体积(在灰质质量局部差异的大小和方向上存在不同),有研究认为大脑中绝大多数“马赛克”在两性之间基本上是重叠的,大脑中的局部差异很小。然而,有研究表明男性和女性确实具有不同的大脑特征,使用结构脑成像得到的分类准确率超过90%。大量实验在关键发育期(如青春期)的特定时间点对大脑二型性进行研究,探究生物性别中大脑二型性的特定年龄问题。
本文对青少年大脑认知发展(ABCD)样本中的结构像(T1)得到的形态测量特征,使用支持向量机分类器(SVC)来测试其分类效力。使用大脑形态测量和图像强度测量作为生物性别的预测特征。如果SVC能够利用这些特征成功对生物性别进行明显高于偶然性的分类,就证明大脑中存在二型性,并在发育期存在可测量的大脑性别标记物。此外,通过儿童行为检查表(CBCL)综合征量表和《精神障碍诊断与统计手册》第5版(DSM5)为导向的量表,探究大脑形态计量对两性临床症状学的潜在影响。
3.材料与方法
3.1样本的人口统计数据
从ABCD数据集中获得11533名受试者的结构MRI数据。排除标准如下:(1)T1扫描没有通过原始数据质量控制的受试者;(2)没有通过FreeSurfer质量控制的受试者;(3)缺失T1相关形态计量或强度特征数据的受试者;(4)缺失认知和临床测量数据的受试者。最终样本包括8325名参与者(mean SD age=119.07 7.48months),其中包括4308名男性(年龄= 119.157.46months)和4017名女性(年龄= 118.997.50months)。男性和女性的年龄(对大脑形态计量学存在影响)不存在显著性差异,t(8325)=0.95,p =0.34,贝叶斯因子值为0.04。
3.2样本的MRI数据
ABCD研究提供了结构像的形态测量和图像强度值,这些值作为本研究的预测特征。使用FreeSurfer的自动处理流程对皮质表面进行重建,从T1像创建形态测量和图像强度测量。皮质灰质和底层白质体素的标签根据基于表面的非线性配准到Destrieux图谱,基于该图谱提取ROI。形态测量包括四类:皮质厚度、皮质表面积、皮质体积和沟深度。虽然这些测量是相关的,但在灰质完整性上存在差异,且有些(表面积/厚度)具有遗传独立性。图像强度测量包括三类:平均灰质强度、平均白质强度和沿灰白边界的平均对比度:GWC=(白-灰)/(白+灰)。GWC是组织完整性和髓鞘降解局部变化的敏感指标,这可能反映了一种独特的生物信号,该信号随年龄不断变化,并且较皮质厚度增加了临床敏感性。对148个ROI提取每一个特征(每个半球74个ROI)。将左半球所有ROI的平均值、右半球所有ROI的平均值以及所有ROI的平均值也作为预测特征。
3.3支持向量机分类
SVC是一种分类算法,试图在预测特征的超空间中找到一个最佳分离二元类(男性和女性)的超平面。将上述提到的四类形态测量和三类图像强度值作为该样本性别分类的预测特征。对所有受试者的1057个特征进行标准化,并将其通过scikit-learn机器学习库输入到线性SVC,来预测个体性别(参数C=0.01)。目标变量性别编码为女性“1”,男性“0”。分类决策是通过权重和输入数据的线性组合进行计算: = Tx+b。如果结果为正,则预测结果为女性;为负,则预测为男性。采用交叉验证的10000次迭代模拟方法评估SVC的性能。即在每一次迭代上,分类器在数据的随机子集(80%)上进行训练,并在剩余子集(20%)上进行测试。
为验证上述线性SVC方法,还进行了另外两项分析。首先,将线性SVC性能与深度学习进行比较,来验证是否可以通过非线性机器学习来提高分类性能。所有特征均包括在内。对TensorFlow 2创建的全连接的密集网络(two hidden layers,eachsize=128,Reluactivation,output size=2,softmax activation;loss=sparse categorical cross-entropy,optimizedwith Adam,batch normalized)进行训练和测试(80%训练,20%测试)。其次,由于该样本招募了表现出内化和外化症状的儿童,可能会影响分类效果。为了确保分类不会因内化和外化严重程度的差异而产生偏差,使用线性SVC程序对原始数据集的三个三元组进行测试:将报告的内化和外化行为分为低、中、高三个水平(内化+外化原始分数;低:0–3,中:3–10,高:10–83)。最后,对七个输入特征集中的每一个特征集使用上述SVC程序,来评估这些不同特征类型对个体的重要性和贡献。
3.4确定重要贡献的特征
线性SVC的一个优点是非零特征权重可能有助于成功分类。使用置换法进行模拟,来评估所观测到的特征权重对成功分类的重要性:将第一次模拟得到的平均观测特征权重(对10000次迭代结果取平均值)与特征权重的零分布进行比较。使用SVC程序得到这些特征权重的零分布,在10000次迭代的第二次模拟中使用分类标签(性别)的随机分配。此模拟得到每个特征的权重分布近似正态(mean Shapiro-Wilkstatictic:0.9998);因此,这些样本可定义每个特征的正态分布,与观测到的权重进行比较并确定显著性。每个特征在95%置信区间外的平均观测权重(Bonferroni校正:n = 1057;mean4.069SD)是成功分类的重要因素。
3.5临床措施及探索性分析
ASEBA是ABCD数据库中的精神健康评估系统之一,包括CBCL量表和DSM-5量表。利用线性SVC探究脑特征,本文进行了一项探索性研究来评估这些二型脑区域在调节性别与临床症状间关系中的作用。
4.结果
4.1SVC性能
表1显示了对所有特征和每个特征集的分类性能。对所有样本(所有输入特征)的分类正确率为86.3±0.8%(mean),包括七个特征集:皮质厚度、脑沟深度、皮质面积、皮质体积、T1灰质强度、T1白质强度和T1 GWC。与线性SVC相比,深度学习并未提高分类性能:训练准确率为100%,测试准确率约为85%。因此,未对这一性别分类模型进行进一步研究。所有特征的分类准确率按照内化和外化行为的严重程度划分后,其结果大多保持不变,并且使用线性SVC对三个组测试得到分类准确率相似(低= 82.9±1.4%,中= 83.3±1.4%,高= 82.4±1.5%)。因此,对有助于分类的特征的测试是基于全样本,而不是分层样本。七个特征集的所有预测都显著高于偶然水平,准确率范围为69.4%(白质强度)至76.0%(皮质面积)。
4.2具有显著分类效果的特征
识别出具有显著正权重的四个特征( >0,类别1,女性特征,红色区域)和具有显著负权重的九个特征( <0,类别0,男性特征,蓝色区域),并通过fsbrain可视化软件包进行可视化(图1)。
图 1 可视化所有具有显著权重的大脑区域的可视化。L:左半球,R:右半球。红色:正权重(女性特征),蓝色:负权重(男性特征)。
权重为正的区域包括右侧中央后回(皮质厚度)、左侧长岛回和岛叶中央沟(皮质体积)、岛叶环形沟左前段(皮质体积)和颞极(GWC)。权重为负的区域包括左侧枕上回(皮质厚度)、右侧舌回(沟深度)、外侧沟左后支(皮质区)、左侧中央前回(皮质体积)、右侧胼胝体周围沟(灰质密度和白质密度)、岛环沟左上段(GWC)、右侧枕颞外侧回(GWC)和岛环沟右上段(GWC)。表2展示了这些特征的标签和权重。
图 2 13 个特征的描述性统计(均值和标准误差)。L:左半球。R:右半球。WM:白质强度。GM:灰质强度。
图2展示了这13个特征的描述性统计(平均特征权重和标准误差),以表明机器学习多元方法和单变量统计间的敏感性差异。虽然这13个特征能成功分类,但其多变量特征并不是单变量特征的混合;这些特征中的大多数在很大程度上是重叠的或处于其他方向上(如,左侧长岛回&岛叶中央沟,岛叶环形沟的左前段)。
SVC 是一种多元模式分析方法,因此对特征间的非线性依赖性很敏感;因此,能够捕捉到大脑内更复杂的二型性模式。在使用这13个特征作为生物性别预测因子的线性SVC模型中,得到这些特征的平均分类准确率为70.8 ± 1.0%。特征类型中的任一半球(或两个半球一起)的平均特征值不能作为显著特征。
4.3调节性别与临床症状关系的二型特征
对13个二型区域(作为性别和临床症状间关系的调节因子)进行了平行测试。其中三个区域(岛环沟上段、外侧沟左后支和左中央前回)被认为是各种临床症状的调节因子。但是,多重校正后,并未观察到临床症状的显著调节因子。
5.讨论
使用形态测量和图像强度值作为预测因子,能够对大样本的男性和女性(9-10岁)进行性别分类,准确率约为86%。还确定了13个显著特征,成功对男性和女性进行分类。本文研究不仅描绘了生物性别的大脑标记物,还有助于概述男性和女性在发育期的独特轨迹。
ABCD 数据集一个明显的优势是样本量大。在8000 多个样本中,本文的分析方法可以很好地揭示大脑差异。另外,从 FreeSurfer 处理后得到的输入特征有两个优势。首先,这些大脑测量可以表示大脑形态测量的特征,可以从单一扫描类型(如 T1 图像)得到多种生物变量。任何单一特征类型只能达到 76.01% 的分类准确率,而所有特征类型集合的预测能力更强。其次,特征多样性导致数据高维性,可以更好的进行线性可分,同时也不会因足够多的观测特征而受限于“维度诅咒”。Destrieux图谱也有利于降维。数据结构很重要:通过线性分离数据的可能性,本文使用的模型较其他非线性方法更具解释性,同时可以使用高维SVC检测基于这些特征分类的非线性依赖性。实际上,本文所用的SVC方法的性能相当于一个参数化模型。SVC方法可以很好的检测二型性,同时较更传统的统计学方法具有同等的解释性。
可通过同时观察特征权重和特征均值来理解SVC较单变量方法的优势。正或负权重不一定具有类似的均值差异;因此,使用单变量方法进行分析无法检测这种差异。单变量方法试图确定组间足够大的均值差异,使用以假阳性率为条件的零假设显著性检验方法进行评估(通常α设置为0.05)。而SVC通过学习一个决策边界,可以最好地将数据分成两个给定的类。本文认为“大脑马赛克”是一个复杂但可测量的非线性特征组合。
有趣的是,半球(或两个半球一起)的平均特征值不能作为显著特征。不清楚是由于该数据集的年龄范围受限,还是局部特征对分类更重要。局部特征可用于区分男性和女性,仅使用13个局部脑特征,准确率达76%。
性别二型性和行为二型性间的关系很复杂,目前尚不清楚。有研究表明,几个二型的皮质区域与边缘系统有直接关系,包括颞极、左侧岛叶和左侧外侧沟的多个沟、右侧岛叶的圆形沟、左侧中央前沟、右侧后中央沟和右侧胼胝体周围沟。
在本文分析中得到岛叶周围的几个区域为二型。GWC反映了大脑皮层和下表白质的不同髓鞘分化,岛叶、扣带回和中央前/中央后皮质内存在的GWC个体差异与青少年的心理健康和一般认知功能有关。圆形沟勾勒出岛叶的周长,将其与颞叶、额叶和顶叶分开。有研究表明岛叶可能是情感功能障碍和情绪障碍的根源。
本文观察到在颞极中的GWC的二型性。颞极是颞叶最前部的一个边缘旁区域,和精神分裂症和精神病中的岛叶有关。同时还观察到初级感觉区(如枕上回、舌回和中央后回)存在二型性。用于言语的运动区也表现出二型性,本文分析的左侧中央前回也具有二型性。
虽然仅13个区域就表现出良好的预测准确性,说明二型分布具有稳健性,但还需要更详细的研究来探究本研究得到的二型性是否对感知加工和更复杂的行为有影响。事实上,仅仅因为所确定的区域与二型性行为具有相同的功能作用,就将大脑二型性(尤其是这种二型特征中的单一特征)认为是行为二型性的因果关系,这是不正确的。对本文分析中的区域进行针对性研究,来探究大脑二型性是否在行为二型性或临床表型的行为特征中具有功能作用是很重要的。虽然在多重比较校正后,并没有得到调节性别和临床症状间的显着特征,但未来可以进行研究来确定性别、大脑二型性和临床症状之间的关系。