这篇小二区的文章你也能轻松学会
Identification of a blood-based 12-gene signature that predicts the severity of coronary artery stenosis: An integrative approach based on gene network construction, Support Vector Machine algorithm, and multi-cohort validation基因网络、向量机算法和多队列验证筛选出的基于血液的12基因标志可预测冠状动脉狭窄严重程度
一. 研究背景
评估冠状动脉狭窄的严重程度对于冠状动脉疾病的治疗至关重要,由于心脏成像方法存在局限性,因此基于血液的生物标志物是新的预测方法,但目前的预测性能均不佳,故而识别新的分子标志以反映冠状动脉狭窄十分必要。
近年来,基于血液的基因表达评分(GES)被认为是预测冠状动脉粥样硬化的一种有前途的生物标记物策略,但目前没有良好的可重复的基因标志。作者以基因表达综合数据库(GEO)为基础,通过加权基因共表达网络分析(WGCNA)和蛋白互作网络(PPI),筛选出核心基因,并通过两个独立验证队列进行验证,最后建立了基于GES12的列线图。
二. 分析流程
三. 结果解读
1. 通过WGCNA在发现集中构建网络
表1. 发现集、训练集和验证集的临床数据
发现集:GSE12288
作者从GEO数据库下载基因表达谱数据(GSE12288),并仅对其中110名冠心病(CAD)患者的数据进行分析。首先通过平均联动层次聚类确定其中离群样本(GSM308690)并移除(补充图2A),利用剩余的109个CAD样本建立WGCNA模型,选择β=3为软阈值(补充图2B),鉴定出11个共表达模块(补充图3、图1A)。
补充图2. WGCNA建模过程
软阈值的选择:本文中作者以R²=0.9画线,选择最靠近这条线的power作为软阈值,图中为3
图1A. 基于差异度量的网络树状图和已识别模块的颜色
补充图3. WGCNA中基因模块
作者对每个模块的特征基因进行多变量线性回归分析,发现棕色模块的特征基因水平与Duke指数显著相关(图1B),随后对棕色模块进行功能富集分析(图1C)和基因-疾病相互作用分析(图1D),以显示其生物学过程和相关疾病。
图1B-D. 筛选棕色模块
B:模块特征基因与Duke指数的相关性矩阵图,只有棕色模块表现出显著相关性(p<0.05)
C:棕色模块的功能富集分析,与冠心病相关,涉及到炎症、氧化应激、一氧化氮生物合成等
D:基因-疾病相互作用分析,与心血管疾病相关,包括动脉粥样硬化、血管疾病、冠心病等
综合以上结论,作者接下来在含有1148个基因的棕色模块中选择核心基因。
2. 棕色模块核心基因的鉴定
作者通过WGCNA(补充表3)以及PPI网络(补充图4)在棕色模块中分别筛选出30、47个核心基因。
补充表3. WGCNA筛选出的核心基因
筛选条件:1) 模块隶属度>0.75;2) 相关系数(绝对值)>0.2;3) FDR<0.05
补充图4. PPI网络筛选出的核心基因
筛选条件:degree>4
并通过取其交集进一步确定了15个核心基因(补充图5A)。
补充图5A. 确定核心基因
随后通过聚类分析来验证结果,发现这15个基因将109个CAD样本分为两个样本簇(补充图5B),且两个样本簇间的Duke指数存在显著差异(补充图5C),满足基因标志的前提。
补充图5B-C. 核心基因的检验
3. 构建可以预测冠状动脉狭窄严重程度的GES12
训练集:来自河南省郑州大学第一附属医院的151名冠心病患者
作者在训练集中,用RT -PCR定量分析了15个核心基因的表达,并根据Duke指数的中位数将冠心病患者分为两组,支持向量机(SVM)算法显示,12基因组合在预测Duke指数方面表现最好(图2A、补充表4、补充表5)。
图2A. n基因标志的预测准确性
补充表4. n基因标志的预测准确性
列出了图2A中的详细数据,其中GES12准确性最高
补充表5. GES12的组成基因
logistic回归分析显示,所有12个基因的表达水平都与Duke指数显著相关(表2)。
表2. 15个核心基因与Duke指数的相关性研究
为了测试这12基因标志是否存在过度拟合的风险,作者依次移除每个基因来进行敏感性分析(图2B)。
图2B. 移除单个基因之后的AUC对比
无论移除哪个基因,AUC均会减小,说明12个基因中的每一个对于预测更高的Duke指数都是必不可少的
最后作者利用单因素logistic回归得到的相应系数对12个基因的表达水平进行加权,建立了GES12的风险评分模型:
β:单因素logistic回归得到的各个基因的相关系数(表2)
E:各个基因的表达量
图2C. GES12的预测性能
GES12的最佳切点为4.983,即以4.983区分高/低风险组,对应的最大Youden指数为0.460,特异性为0.747,敏感性为0.713
补充表6. GES12在不同方面的预测价值
4. GES12预测疑似冠心病患者冠状动脉狭窄程度的内外验证
内部验证集:从河南省郑州大学第一附属医院招募的209名患者
外部验证集:从湖北省武汉大学中南医院招募的206名受试者
作者进一步在两个数据集中验证GES12的预测性能(图2D-I)
图2D-I. GES12的预测性能
D、G:两组验证队列均显示出GES12可以用于预测Gensini评分和Sullivan评分
E、H:校正曲线显示GES12的预测值与实际观测值吻合良好,说明GES12模型拟合良好
F、I:与低风险组相比,高风险组的患者Gensini评分和Sullivan评分普遍更高
5. GES12对梗阻性冠心病的诊断价值以及对血管重建的预测性能
补充表7. CAD风险因素对GES12预测CAD事件性能的影响
图3. GES12预测梗阻性CAD的性能
A-B:GES12有效区分梗阻性CAD患者与非CAD受试者,且不会受到心血管危险因素的影响(补充表7)
C-D:当冠状动脉造影中定义梗阻性CAD的参考标准设定为狭窄程度55%-75%时,由AUC确定的GES12的诊断性能高于0.75,但在狭窄程度80%-90%的极端标准下GES12的诊断性能略降至0.71-0.72
E-F:在基于血管的分析中,评估了GES12在三个主要冠状动脉中的鉴别性能,ROC曲线显示了相似的AUC,用于检测左前降支(包括左主冠状动脉)、左回旋支和右冠状动脉处>50%的狭窄(图3E和F)
G-H:在血管造影后的30天随访中,两个验证队列中约58%的患者接受了外科或经皮血管重建(表1),GES12预测血管重建的AUC约为0.77
6. 根据GES12和传统心血管危险因素建立列线图
补充表8. 冠心病患者Duke指数增高的独立风险因素分析
作者综合了Duke指数较高的独立风险因素(补充表8),包括GES12、吸烟状态、高血压状态、低密度脂蛋白胆固醇(LDL-c)水平和体重指数(BMI),开发了一个临床应用的列线图(图4A)。
图4A. 基于GES12的临床列线图
图4B-C. 列线图与GES12的性能对比
B:列线图展现出了比GES12更高的判别优势
C:决策曲线分析显示出列线图在几乎所有风险阈值范围内具有更大的净效益
作者还在训练集中比较了列线图和GES12的分类性能。
补充表9. 训练集中列线图的重新分类能力
151名患者中,57名(38%)被列线图重新分类,其中41名(72%)重新分类正确,只有16名(28%)重新分类错误,展现出了比GES12更好的分类性能
在两个验证队列中,列线图在鉴别冠状动脉狭窄(补充图6)、临床实用性(补充图7)和风险重新分类(补充表8)方面也显示出更加良好的性能。
补充图6. 列线图鉴别性能
在Gensini评分、Sullivan评分和梗阻性CAD中,列线图都展现出了良好的鉴别性能
补充图7. 列线图的决策曲线分析
在Gensini评分、Sullivan评分和梗阻性CAD中,列线图也展现出了良好的净效益
补充表9. 内外验证集中列线图的重新分类能力
7. GES12与斑块表型的关系
由于动脉粥样硬化病变不仅取决于管腔狭窄的程度,还取决于斑块表型,作者进一步评估了GES12与血管内超声检查(IVUS)所定义的斑块特征之间的关系,作者通过单尺度IVUS在152例患者中共鉴定出202个病灶。
补充表11. GES12与斑块表型相关
基于病变的分析发现,GES12所定义的高风险组的斑块负荷以及体积均高于低风险组
补充图8. GES12和列线图与斑块标志物的相关性
在基于患者的分析中,GES12或GES12衍生的列线图对VH-IVUS定义的薄帽纤维化动脉瘤(TCFA)和斑块负荷有着良好的鉴别能力
以上结果表明GES12与斑块标记物之间可能存在联系。
小结