在卫生统计学中,当我们进行多个假设检验时,如果不做任何调整就直接使用相同的显著性水平(比如常用的0.05),那么随着检验次数的增加,错误地拒绝一个或多个真实原假设的概率也会随之增大。这种错误被称为I型错误,即假阳性错误。具体来说,在单次比较中设定的显著性水平为0.05时,表示在假设成立的情况下有95%的可能性不会犯错;但如果进行了多次独立的假设检验,则总体上至少有一次出现I型错误的概率将大大高于0.05。
例如,如果我们对同一数据集执行10个独立的假设测试,并且每个测试都使用0.05作为阈值,那么所有这10次测试都不会犯错的概率为(1-0.05)^10 ≈ 0.6。这意味着,在这种情况下,至少有一次测试会错误地拒绝真实原假设的概率达到了约40%,远远高于单个测试时的5%。
因此,为了控制整个研究中的总体I型错误率(即在整个分析过程中错误地发现显著结果的最大概率),我们需要对多重比较进行校正。常见的方法包括Bonferroni校正、Holm-Bonferroni方法、Benjamini-Hochberg程序等。这些方法通过调整每个单独测试的p值或阈值来降低整个研究中的假阳性率,从而确保结论更加可靠。
总之,在卫生统计学中对多重比较进行p值校正是为了减少由于多次检验而导致的I型错误累积效应,提高研究结果的真实性和科学性。