两组均值的95% CI重叠,t检验的P值必须大于0.05吗?
医疗咖啡厅
2019-11-06 20:52
经常有孩子问我:区间估计的95%可信区间(95% CI)和假设检验的P值等价吗? 更具体的问题是:两组均值的95% CI是否重叠,t检验的P值必须大于0.05?
答案是:不一定。 如果两组均值的 95% CI 不重叠,则 t 检验的 P 值必须小于 0.05; 但如果两组均值的 95% CI 重叠,则 t 检验的 P 值可能大于 0.05 或小于 0.05。
为什么是这样?
由于t检验需要考虑方差齐性问题,计算公式相对复杂,并且当n足够大时,t分布接近标准正态分布。 这里我们用符合标准正态分布的Z检验来解释上面的问题(如果用t检验的公式会更复杂,但结果是类似的)。
1. Z检验的95%置信区间
我们假设两个样本,N1=64,N2=81,其他参数如下。
打开网易新闻查看精彩图片
可以看出,样本1均值的95% CI为(62.4, 97.6),样本2均值的95% CI为(90.4, 129.6),两个95% CI有重叠。
95%置信区间的估计公式为Mean±1.96*Se。 那么,对于两个样本(假设样本1的均值较小),判断95%CI是否重叠,需要判断样本1的95%CI上限是否大于下限95样本2的% CI,相当于判断Mean1+1.96 *Se1-(Mean2-1.96*Se2) > 0为真。 即Mean2-Mean1
2. Z检验的P值
打开网易新闻查看精彩图片
3. 95% CI与P值的关系
打开网易新闻查看精彩图片
打开网易新闻查看精彩图片
实际上,上述1.96是标准正态分布Z0.05/2对应的边界值,对应无限自由度t分布的边界值。 如果采用t/t'检验,由于单样本区间估计与二样本t/t'检验的自由度不同,检验边界值会略有不同,情况也比较复杂。
但结论是相同的,即:如果两组均值的95% CI不重叠,则t检验的P值必须小于0.05; 但如果两组均值的 95% CI 重叠,则 t 检验的 P 值可能大于 0.05,也可能小于 0.05。
目前开放共享的数据是“中国房颤登记研究”,共有超过25000条房颤数据。 欢迎申请数据使用并发表SCI论文!
平台网址: