【关键词】 统计学; 生物医学; 实验设计; 统计分析
在生物医学科研工作中,人们面对的是具有极大变异性的生物体,而研究具有变异性事物或现象的变化规律,离不开统计学的思维方法和技术手段,因此,统计学起着不可替代的作用。遗憾的是统计学的理论比较深奥,要考虑的问题非常多,应用时灵活性又非常大,每当实际工作者(包括科研工作者、临床医生、杂志编辑等)要运用较复杂的实验设计知识和统计分析知识时,常感到心中无底,有时甚至望而生畏。问题的症结并非出自于实际工作者本身,主要原因应该归结于现行的医学(或卫生)统计学教科书。因为传统的统计学教科书中所写的内容几乎都是经过统计学工作者加工后的半成品,它们是一代又一代统计学工作者经过多年“修剪”出来的“标准型”。实际工作者拿着自己的问题(通常是披着假象的“表现型”),试图通过比照这些“标准型”找到解决问题的办法,但“表现型”与“标准型”之间常常并非完全一致,因此,盲目套用十有八九会出错。要想不出错,必须弄清每个“表现型”的本质(即问题的“原型”),倘若能将“原型”正确地转变成对应的“标准型”,问题也就迎刃而解了。也就是说,一本好的统计学教科书应该明确讲述与每个实际问题对应的前述“三型”(绝对不能只讲述“标准型”),实际工作者才可以少花时间和精力,学到统计学的精髓,才能 在生物医学科研工作中发挥统计学的作用,真正达到提高统计学的应用水平和提高科研质量的目的。
1 时代呼唤正确的统计学思想
生物医学技术日新月异,对统计学提出了越来越高的要求。时代呼唤正确的统计学思想,而不是照抄和盲目套用那些繁琐的统计学公式。正确的统计学思想是什么?是用辩证的思维去观察事物,是用透视的眼光去洞察事物,即能够透过现象看本质的统计思维模式,概括起来为“八性”和“八思维”。 统计学在看待事物和处理问题时,离不开下列“八性”,即“延展性与概括性”、“随机性与均衡性”、“系统性与代表性”和“自悖性与相合性”。同时,还离不开下列“八思维”,即“从静态思维到动态思维”、“从正向思维到逆向思维”、“从简单思维到复杂思维”和“从横向思维到纵向思维”。
2 统计思维模式的“八性”和“八思维”
2.1 “八性”
2.1.1 延展性 人们所面对的研究对象的数目往往是无限大的,逐个加以研究几乎不可能,有时具有很大的破坏性(如贵重的精密仪器设计质量的实验研究),统计学告诉人们可以只研究其中很小一部分,由此去推论总体的规律性。例如,根据几十人,最多几百人的临床试验研究,就能决定一种新药是否可以用于临床诊治某些疾病,这就是说统计学具有延展性。
2.1.2 概括性 统计学不是堆放全部数据的仓库,而是抽象出数字特征,用以概括表达数据的内在规律性,不仅形象生动,而且言简意赅。例如:测出一万个正常成年人的血压值,计算出平均值、标准差和95%正常值范围和总体均值的95%置信区间,就等于掌握了这一万个血压数值的变化规律,这就是说统计学具有概括性。
2.1.3 随机性 在自然界(特别是生物医学研究)中,由于变异性的普遍存在,又由于通常无法研究总体中的全部个体,随机抽样研究是确保样本具有代表性的重要措施。例如:每个正常成年人的血小板数值并非一样,若将全国正常成年人的血小板数值都测量出来,自然就知道了全国正常成年人的平均血小板水平了,但测定的数量太大,费用、时间和人力都承受不起;若从全国各地随机抽取(不是人为选取)最有代表性的一部分正常成年人,由他们的测定值也能较好地估计全国正常成年人血小板的平均水平,估计的结果是否足够准确,主要取决于随机化的效果(它体现了代表性的好坏)和样本含量的大小,这就是统计学上十分强调的随机性。
2.1.4 均衡性 与研究问题有关的因素往往很多,作为试验分组的因素通常是反复挑选出来的为数较少的几个,由它们决定的各小组之间在其他因素方面是否均衡一致,将直接关系到结论的正确性!例如,要考察一种新药的疗效如何,若试验组患者使用新药,对照组患者使用目前市面上治疗该病最好的药,但由于患者入组时未进行严格的随机化。结果发现,年龄大的患者比较保守,绝大多数都进入了对照组,试验结果显示,新药疗效优于对照药疗效,但这个结论却令人怀疑,因为两组患者在年龄上相差悬殊,况且,往往年龄大的患者病情较重、患病时间较长,难以治愈。所以,要使实验研究的结果具有较高的可信度,组间的均衡性是不可忽视的,这就是统计学上特别强调的均衡性。
2.1.5 系统性 实际工作者在科研中经常“顾此失彼,丢三落四”,应当系统地全面地考虑问题,以免所做的研究工作前功尽弃。任何一项科研工作,从开始构思到得出结论,需要经历很多步骤,其中任何一步考虑不周,都可能会使整个研究失败。比如,实验设计错了或数据整理的格式错了或统计分析方法选择错了或结果解释错了,都可能导致结论的错误,这就是说在统计学上考虑问题要全面、系统,方可得出正确结论。
2.1.6 代表性 统计学不单纯是处理实验数据的 学问,它更关注实验数据的来源和专业含义。这意味着强调实验数据的代表性如何,它肩负着谁的使命,它将为谁说话。更明确地说,实验数据反映的信息是否全面、准确,将直接影响结果和结论的正确性。例如,若想通过抽样调查了解全国正常成年人的身高的平均水平,若在北方地区与南方地区抽样的人数与当地正常成年人的人口数不呈正比例,当北方地区抽取的人数占的比重大了,其身高数据的样本平均值会明显高于全国相应指标的平均水平,反之亦然。这就是说,样本必须具有很好的代表性,在此基础上,由足够大的样本去推论总体的规律性才不会出错。
2.1.7 自悖性 统计学中的方法并非总是万能的,有时不同方法处理同一个实际问题其结果是自相矛盾的;有时统计学结论与专业结论是不相容的。例如,Simpson(1951)提出的关于吸烟与否是否会导致肺癌发生的调查资料,不同的分析策略,将得到自相矛盾的结论[1~2]。
2.1.8 相合性 统计学不能脱离专业知识,应根据研究目的、设计类型、资料特点,选择合适的方法描述和分析资料,整个过程应具有相合性。例如,有人为研究两种检测方法检测同一批患者的血样,看结果是否具有一致性,每次检测都有4种可能的诊断结果,即正常、轻度病态、中度病态、重度病态,研究者将检测结果写成两行,第一行是甲法检测全部患者所得到的结果,第二行是乙法检测全部患者所得到的结果,这样记录和整理资料,其统计分析方法也就跟着发生了改变,就不可能达到原先想达到的研究目的了。这就是说在统计学上应注意相合性。
2.2“八思维”
2.2.1 从静态思维到动态思维 很多人习惯用静态思维模式取代动态思维模式,因为静态条件下,可使复杂问题变得非常简单。事实上,这样做在很多场合下得出的结论是经不起推敲的或经不起时间考验的,更确切地说,其结果不具有“重现性”。例如:有人用某药治疗某病患者6人,治愈3人,便得结论:该药对该病的治愈率为50%.请问错在哪?很显然,在如此小的样本上,显示出的药物疗效具有一定的偶然性,谁也没有把握断言,再用该药治疗该病患者100人,会有多少患者能够被治愈。应当在较大范围内选取较多的该病患者用此药进行治疗,并对所获得的实验结果进行统计学推断,以95%以上的置信度推断此药对该病的治疗效果如何,其结论才能令人信服。
2.2.2 从正向思维到逆向思维 统计学的教与学,一般都是从正面入手,学习者只知道一些常规的做法,但一碰到实际问题与所学的内容不完全一样时就不知道该怎么办,常常是生搬硬套。然而,当教学过程中,不仅从正面讲授,还注意从反面揭示误用统计学的案例,可使学习者“吃一堑长一智”,痛定思痛,立志认真学好统计学,转被动学习为主动钻研,勤于动脑,勇于实践,效果必然明显。这就是“逆向统计教学法”成功之奥秘。
2.2.3 从简单思维到复杂思维 美国于1958年开始在外科手术中采用麻醉剂氟烷,到1962年突然掀起一场风波—— —麻醉剂氟烷有严重的副作用,导致部分患者病情恶化、发热、肝脏大片坏死而死亡。这关系到麻醉剂氟烷能否继续使用!这场风波产生于简单思维,因为某些人仅根据部分病例的表现得出了虚假结论。后来进行大量调查研究,将各种混杂因素对结果的影响尽可能降到最低限度,借助统计学考虑问题的均衡性和系统性,从而平息了风波,体现了复杂思维的价值。
2.2.4 从横向思维到纵向思维 当人们希望了解事物的内在联系时,不仅要进行横断面研究,还需要进行纵向追踪研究。因为横断面研究只能揭示事物之间的静态联系,而且,有些观察到的联系可能带有一定的假象,甚至说不清楚谁是原因,谁是结果。纵向追踪观察,则可以比较真实地展现事物内在的联系和发展变化规律。例如,同时调查15~25岁的一群人的身体发育情况与对一群15岁的人连续观察身体发育情况10年所得的两批调查数据,其结果和结论可能相差很多,前者的结论仅供参考,若质量控制做得好,样本足够大,则后者的结论具有很高的可信度,对未来的研究和政策制定具有更大的指导意义。
3 统计学三型理论[3,4]
3.1统计学三型理论概述 进行生物医学科研工作离不开统计学,而要想把统计学应用正确,又离不开正确的统计思想。正确的统计思想由前述的“八性和八思维”组成,其精髓是“透过现象看本质”。事实上,很多与统计学有关的实际问题,均以“表现型”的面貌呈现在人们的面前,表现型常常带有假象,直接依据“表现型”去盲目套用传统的统计学教科书上的“标准型”,十有八九会出错,因此,要想正确运用统计学,必须弄清反映“表现型”本质的“原型”,将“原型”正确转变成“标准型”后,就很少会出错。这样一种由笔者创立的可有效解决问题的新理论,被称为“统计学三型理论”[3,4]。
3.2 统计学三型理论应用举例 统计学三型理论听起来好象很抽象,其实,它却非常具体、实在。请看来自生物医学科研的两个简单实例,不仅很容易理解这个理论,而且会发现此理论大有用武之地。
例1 某研究者希望考察A、B两药物升高白细胞的疗效,以用药前后白细胞的改变值作为评价 疗效的指标,设计了如下的4个组,每组用20只小鼠,观察白细胞的数值。第1组:空白对照组第2组:单用A药组第3组:A、B药联合使用组第4组:第3组的空白对照组请问:这样设计实验错在哪里?对差错的辨析与释疑 这位研究者给出了该实验设计的“表现型”,它不能很好地实现原先的研究目的。事实上,完全没有必要设置两个空白对照组,白白地浪费了20只小鼠。事实上,要想揭示A与B药联合使用后是协同作用还是拮抗作用,不仅需要A、B药联合使用组和单用A药组,还需要单用B药组,故与本实验研究对应的实验设计的“原型”为下面的结构: 第1组:空白对照组 第2组:单用A药组第3组:单用B药组第4组:A、B药联合使用组若确实按此“原型”所决定的结构去做实验,各组均有20个白细胞的改变值,如何对数据进行统计分析呢?很多人又盲目地去套用传统的统计学教科书,认为这是一个“单因素4水平设计定量资料”,便不假思索地选用“单因素4水平设计定量资料的方差分析”处理此资料。这样做仍是被表面现象迷惑住了,因为4个组可能会有三种情况,第一种是真正的单因素4水平设计;第二种是两个或多个因素水平不完全组合而成的四个组;第三种是两个各有 2水 平的因素的水平全面组合而形成的四个组。只有弄清究竟属于这三种情况中的哪一种,才能选用合适的统计分析方法予以处理。本例属于第三种情况,将这个“原型”正确地转变成对应的“标准型”后,其结构见表1.
表1 A与B药单用及联合使用的实验设计模式(略)
表1的结构在统计学上被称为两因素析因设计或2×2析因设计,若其定量资料满足参数检验的前提条件(通常为独立性、正态性和方差齐性),应选用两因素析因设计定量资料的方差分析处理资料为宜,否则,需要寻找合适的变量变换方法,若变换后的数据满足参数检验的前提条件,再对其使用前述方法处理。例2 某临床医生收集到一组临床资料,见表2.该医生用成组设计定量资料的 t 检验对表中的8组数据进行了两两比较,试问这样做其错误的实质是什么?对差错的辨析与释疑 显然,表中的定量测定结果受到两个实验因素(组别与时间)的影响,而成组设计定量资料的 t 检验通常只适合处理单因素两水平设计(或叫成组设计)定量资料。换句话说,原作者将该资料人为地拆分成多个单因素两水平设计定量资料,割裂了整体设计,每次分析资料的利用率很低,又无法考察因素之间的交互作用对测定结果的影响,故结论的可信度降低。其错误的实质是不认识该定量资料所对应的真正的实验设计类型是什么,仅根据“表现型”去盲目套用统计学教科书上的“标准型”,从而犯了严重的错误。那么,该定量资料所对应的“原型”究竟是什么? 改变一下列表的格式,就很容易辨别出其“原型”,见表3.
表2 两组患者手术前后胃电图平均波幅比较(略)
表3 两组患者手术前后胃电图平均波幅比较(略)
“组别”是实验分组因素,即全部患者被分成互相独立的两组,而每组中的每位患者都要在4个不同时间点上被重复观测“胃电图平均波幅”的数值,各组患者在“测定时间”这个因素上被重复观测,而且,整个实验涉及两个实验因素,故此表格所对应的实验设计叫做“具有一个重复测量的两因素设计”。表3的结构既是该实验所对应的“原型”,也是其“标准型”。若其定量资料满足参数检验的前提条件(通常为独立性、正态性和方差齐性,但重复测量资料不满足独立性,需要用高级统计技术予以处理),应选用具有一个重复测量的两因素设计定量资料的方差分析处理资料为宜,否则,需要寻找合适的变量变换方法,若变换后的数据满足参数检验的前提条件,再对其使用前述方法处理。 值得一提的是,术前的测定结果在两组中应相等,否则,没有可比性。若确有差别,可将其视为“协变量”,采用具有一个重复测量的两因素设计定量资料的一元协方差分析方法处理此资料更为妥当。 以上通过分析两个简单的实例可知,统计学三型理论与我们的日常生活和科研工作都密切相关,无论是简单的还是复杂的与统计学有关的实际问题,几乎都可运用此理论作出合理的解释或找到正确的处理方法,有利于提高统计学的正确运用水平和科研工作的质量。
【参考文献】
1Geng Z, Jin H. The causation inference of statistics. In: Fang JQ, Lu Y. Modern medical statistics. Bei-jing: People‘s Medical Publishing House. 2002: 512-534. Chinese.耿直, 金华。 统计因果推断。 //方积乾, 陆盈。 现代医学统计学。 北京: 人民卫生出版社。 2002: 512-534.
2 Hu LP, Zhang TM. Analysis of the important factors affecting the quality of scientific research findings and research papers in China. Ke Xue Guan Cha. 2006; 1(4): 9-19. Chinese.胡良平, 张天明。 影响我国科研成果和学术论文质量的要因分析。 科学观察。 2006; 1(4): 9-19.
3 Hu LP, Liu HG. Triple-type theory of statistics and its application in scientific research of biomedicine. Zhong-hua Yi Xue Za Zhi. 2005; 85(27): 1936-1940. Chinese with abstract in English. 胡良平, 刘惠刚。 统计学的三型理论及其在生物医学科研中的应用。 中华医学杂志。 2005; 85(27): 1936-1940.
4 Hu LP. Application of triple-type theory of statistics in ex-perimental design. Beijing: People‘s Military Medical Press. 2006. Chinese.胡良平。 统计学三型理论在实验设计中的应用。 北京: 人民军医出版社。 2006. Correspondence: Chuan-yue NIU, MD, Professor; E-mail: zhooushi@163.com; Blog: zhooushi.blog.163.com