【1120.】这种错误非常隐蔽,看《中国妇幼保健》上这篇文章就错了,而且还。。。

缘起

按照胡良平教授的理论,数据分为三型:原始型、表现型和标准型。为啥学校学习时一听就懂,拿到数据就一头雾水。原因之一,学校教科书上讲的都是数据的标准型,设计都明明白白。可是拿到真实数据,往往都是原始性和表现型,学的不深,被迷惑双眼,识别不出其“标准型”,因而频频出错。

中国妇幼保健,2020 年 11 月第 35 卷第 22 期,发表的这篇文章“妊娠期和哺乳期乳腺癌患者血清 CA153 HER4 表达情况及与预后的相关性”文章,藏着一处非常隐蔽的错误,大家一起鉴析,他山之石吧!

原文截图

松哥统计说:从统计方法描述来看,计量资料多组间用的是方差分析,两组间比较用的是LSD-t,但是两独立样本t检验不应该说成LSD-t。

松哥统计说:2.2可见,研究两个指标CA153和HER4,分组因素为癌组织和癌旁组织,是来自80例癌症病人组织。

重点来啦

文中给出的表2,这里应该就是作者统计方法里说的LSD-t了吧。结果发现癌组织和癌旁组织这两个指标均有统计学差异。

但是说到这里,大家不知道有没有发现其致命的方法错误呢?

松哥统计说

注意了,表2采用的t检验,从其表格的制作方式以及作者统计方法描述来看,采用的是两独立样本t检验。然而!
表2的数据是来自80例乳腺癌症患者,每位癌症患者检测了癌组织和癌旁组织,那就意味着每个人都进行了两次检测,这是非常典型的“同样异测”的配对设计,因此,表二应该采用配对设计的t检验,而不是两独立样本t检验。
其资料整理,可以整理参考如下配对t检验的格式,只需把治疗前与治疗后,改成癌组织和癌旁组织即可:

为方便大家了解该文,摘要摘出如下:

松哥统计再说

统计似乎永远那么神神秘秘,“难教、难学、难应用”,“学到用时已茫然”,“书到用时翻不到”,“用错用对不知道”,似乎每一位科研人员对统计都有内心的恐惧!

数据虽然只有三种类型(数值、等级和分类),可是变现何止“表现型、原始性和标准型”,很多的时候,更是“野生型”,让人捉摸不透,让人把握不住!

统计之学,一定要先学统计学的思想,思想通了,就可以把握其精髓,以不变应万变!当然,也需要实践再实践,方能成为一位真正具备应用能力的数据处理专家!

松哥统计还说

该文其实并不止这一处错误,还有比这更加严重的错误,而那个错误让这篇文章可信度直跌入谷底!基本判定XX。
(0)

相关推荐