文献精读|基于随机森林的房颤预测模型6分文章

欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO,SEER数据挖掘。


这篇文章分享给大家。文章题为:
A novel atrial fibrillation prediction model for Chinese subjects: a nationwide cohort investigation of 682 237 study participants with randomforest model
文章发表在 Oxford旗下EP Europace杂志,影响因子为6.1分.

image.png

摘要

image.png

文章主要研究内容是开发了一个针对华人的房颤预测模型,使用的数据量达到682237例,按9:1分为训练集,测试集。使用了 F1 值recall values, ROC , K-fold交叉验证等方法来评估模型的性能。

结果展示

研究的人口学特征展示

image.png

第一张结果,展示研究人群的基线数据。

效果评估

image.png

计算了评估指标在各个数据集中的值。

与其它模型比较

image.png

比较了现开发的基于 Random Forest模型与其它模型的 ROC比较,显然 RF表现出了明显的优越性。

讨论

我个人比较喜欢看着一部分的内容。

主要创新点

[图片上传失败…(image-eff977-1571562023964)]

作者说:其实在这个模型之前已经有其它针对房颤的模型了,然而其它模型都是基于西方人口队列的。而本研究是基于中国人群的模型构建,这样的模型才会更适用于中国人。

文章不足

image.png

这一部分很多文章可能就是一句套话,说这个研究是一个回顾性的分析就完了,看看人家作者怎么写的。

  • 不可避免的混杂因素,叫做 cofounding factors

  • 缺少生活方式等数据作为预测因子

  • 本文是基于回顾性分析 retrospective nature of this study

  • 本文是用于预测临床诊断的房颤,而实际上会低估房颤的发生率,因为有些仅仅有症状,或通过心电图才能发现

  • 由于数据的保密性,没能比较对勾预测模型的性能,看哪个是最好的。

  • 创新点同样也是缺陷,因为数据是对华人的,那应用也只能针对华人

One more thing

(0)

相关推荐