2025-09-09 15:41:11

快速理解并计算双样本T检验(带例子)

一、假设检验

假设检验是一种统计学的方法,定义来讲是决定一个样本数据是否支持一个特定的假设,这样我们就可以确定观察的数据是偶然的还是真实的。大白话来讲,假设检验就是提出假设,然后验证假设的真实性,例如我说中国人口的男性平均身高在175cm,那么我就要用一些方法检验我这个假设(例如疯狂抽样各省份的男性测他们的身高),这就是假设检验。

假设检验的基本思想就是提出两个对立的假设:

1.零假设 (H0):通常是一种“无效果”或“无差异”的声明,比如说,两组数据之间没有显著差异,或某项治疗与安慰剂效果相同。

2.备择假设 (H1 或 Ha):与零假设相对,通常表示研究者想要证明的效果,如两组数据之间存在显著差异,或某项治疗比安慰剂更有效。

假设检验的基本步骤:

定义零假设和备择假设。选择合适的统计检验(如t检验、卡方检验等)。计算检验统计量(如t值、卡方值等)。确定显著性水平(alpha值,常用的有0.05、0.01等)。计算p值并与显著性水平比较。基于比较结果,接受或拒绝零假设。

如果p值小于显著性水平,通常拒绝零假设,认为观察到的效果不太可能是偶然发生的,从而支持备择假设。相反,如果p值大于显著性水平,则无法拒绝零假设。

有例子一切才能更清晰。

二、双样本T检验的例子

找两组学生

A用传统学习方法学习并考试

B用新方法学习并考试

H0假设:传统方法和新方法学习的学生成绩相等

H1假设:传统方法和新方法学习的学生成绩不相等

考试之后我们得到一组数据

A:[85,88,90]

B:[92,95,88]

1.算平均值

xA^=87.6,xB^=91.6\hat{x_A} = 87.6,

\hat{x_B} = 91.6xA​^​=87.6,xB​^​=91.6

2.算方差

sA^=2.056,sB^=2.868\hat{s_A} = 2.056,

\hat{s_B} = 2.868sA​^​=2.056,sB​^​=2.868

3.算T值

T=xA^−xB^sA^2nA+sB^2nB=−3.125T = \frac{\hat{x_A} - \hat{x_B}}{\sqrt{\frac{\hat{s_A}^2}{n_A} + \frac{\hat{s_B}^2}{n_B} } } = -3.125T=nA​sA​^​2​+nB​sB​^​2​​xA​^​−xB​^​​=−3.125

4.算自由度

df=3+3−2=4d_f = 3+3-2 = 4df​=3+3−2=4

其中3+3为两组样本的样本量相加

5.查表

可以看到自由度V=4时,显著水平p-value为0.05时的单侧值为2.132,双侧值为2.776(单侧T检验的意思就是我们提出的假设是指定方向的,例如说我想知道新方法是否能提高学生的成绩,而根本不关心是否会降低学生的成绩,此时就是单侧的。但如果我还想关心新方法是否会降低学生的成绩,此时就是双侧的。可以看到单侧的p-value更低,更容易达到统计显著性)

∣−3.125∣>2.776\left | -3.125 \right | > 2.776 ∣−3.125∣>2.776

故,我们有足够的信心拒绝假设H0。

T值正负很明显和样本的顺序有关,对于结果影响并不大。

在正常的计算中我们甚至也可以根据3.125算出它的p-value再与设定的显著水平进行比较(这个方法本质上和比较T值是一样的。

三、总结

总而言之,双样本T检验可以根据统计学的方法算出两组样本之间的差异,并且判断是否有足够的信心支持或者拒绝假设。例如,在做脑科学研究中,我们可以通过各种方法输出正常被试和抑郁症患者的一系列指标,然后通过T检验观察两组人是否有差异,从而得出正常被试和抑郁症患者的大脑存在差异。

中国建设银行SWIFT代码大全
1升水等于几斤?从单位定义到实际应用的全面解析