【1120.】这种错误非常隐蔽，看《中国妇幼保健》上这篇文章就错了，而且还。。。 / 开普饭

缘起

按照胡良平教授的理论，数据分为三型：原始型、表现型和标准型。为啥学校学习时一听就懂，拿到数据就一头雾水。原因之一，学校教科书上讲的都是数据的标准型，设计都明明白白。可是拿到真实数据，往往都是原始性和表现型，学的不深，被迷惑双眼，识别不出其“标准型”，因而频频出错。

中国妇幼保健，2020 年 11 月第 35 卷第 22 期，发表的这篇文章“妊娠期和哺乳期乳腺癌患者血清 CA153 HEＲ4 表达情况及与预后的相关性”文章，藏着一处非常隐蔽的错误，大家一起鉴析，他山之石吧！

原文截图

松哥统计说：从统计方法描述来看，计量资料多组间用的是方差分析，两组间比较用的是LSD-t，但是两独立样本t检验不应该说成LSD-t。

松哥统计说：2.2可见，研究两个指标CA153和HER4，分组因素为癌组织和癌旁组织，是来自80例癌症病人组织。

重点来啦

文中给出的表2，这里应该就是作者统计方法里说的LSD-t了吧。结果发现癌组织和癌旁组织这两个指标均有统计学差异。

但是说到这里，大家不知道有没有发现其致命的方法错误呢？

松哥统计说

注意了，表2采用的t检验，从其表格的制作方式以及作者统计方法描述来看，采用的是两独立样本t检验。然而！

表2的数据是来自80例乳腺癌症患者，每位癌症患者检测了癌组织和癌旁组织，那就意味着每个人都进行了两次检测，这是非常典型的“同样异测”的配对设计，因此，表二应该采用配对设计的t检验，而不是两独立样本t检验。

其资料整理，可以整理参考如下配对t检验的格式，只需把治疗前与治疗后，改成癌组织和癌旁组织即可：

为方便大家了解该文，摘要摘出如下：

松哥统计再说

统计似乎永远那么神神秘秘，“难教、难学、难应用”，“学到用时已茫然”，“书到用时翻不到”，“用错用对不知道”，似乎每一位科研人员对统计都有内心的恐惧！

数据虽然只有三种类型（数值、等级和分类），可是变现何止“表现型、原始性和标准型”，很多的时候，更是“野生型”，让人捉摸不透，让人把握不住！

统计之学，一定要先学统计学的思想，思想通了，就可以把握其精髓，以不变应万变！当然，也需要实践再实践，方能成为一位真正具备应用能力的数据处理专家！

松哥统计还说

该文其实并不止这一处错误，还有比这更加严重的错误，而那个错误让这篇文章可信度直跌入谷底！基本判定XX。

【1120.】这种错误非常隐蔽，看《中国妇幼保健》上这篇文章就错了，而且还。。。