MIENAR
827 字
4 分钟
假设检验的基本概念
一、原假设与备择假设的定义
1、原假设(Null Hypothesis, )
.原假设是指在进行假设检验时,最初假定被检验的参数或总体特性在某一特定值或范围内。一般认为原假设是“无效”或“无差异”的假设。例如:
意思是总体均值等于。
2、备择假设(Alternative Hypothesis, 或 )
备择假设则是在原假设不成立时所接受的假设,通常反映研究者所关注的效应或差异。例如:
二、单侧检验与双侧检验的分类
1、双侧检验(Two-tailed Test)
检验的是参数是否不同于某个值,不关心方向性。例如:
2、单侧检验(One-tailed Test)
检验的是参数是否大于(右侧检验)或小于(左侧检验)某个值。
-
右侧检验(Right-tailed Test):
-
左侧检验(Left-tailed Test):
三、检验统计量与拒绝域
1、检验统计量(Test Statistic)
在假设检验中,根据样本数据构造的一个统计量,用于判断是否拒绝原假设。例如对于正态总体均值的检验,若总体方差已知,检验统计量为:
其中为样本均值,为总体标准差,为样本容量。
2、拒绝域(Critical Region, Reject Region)
拒绝域是指在原假设成立的前提下,检验统计量落入该区域的概率不大于显著性水平的区域。若检验统计量落入拒绝域,则拒绝原假设。
-
双侧检验拒绝域(以检验为例):
其中为标准正态分布的分位点。
-
右侧检验拒绝域:
-
左侧检验拒绝域:
四、两类错误
1、第一类错误(Type I Error)
在原假设为真时,错误地拒绝了。其犯错概率(显著性水平)为。
2、第二类错误(Type II Error)
在原假设为假时,错误地未拒绝。其犯错概率为。
**检验的效能(Power)**为,表示在为真时正确地拒绝的概率。
五、-值与统计显著性
1、-值的定义
-值(概率值,p-value)是在原假设为真时,观察到的样本统计量值或更极端的结果出现的概率。形式化为:
- 双侧检验:
- 右侧检验:
- 左侧检验:
其中为实际观测到的检验统计量值。
2、统计显著性
给定显著性水平(如),若-值小于,则结果被认为是统计学上显著的,即有足够证据拒绝。否则,则不能拒绝。
六、总结流程
- 明确原假设和备择假设。
- 选择适当的检验统计量,并确定其分布。
- 给定显著性水平,确定拒绝域。
- 计算观测值对应的检验统计量,并由此得出-值。
- 比较-值与,作出结论(拒绝或不拒绝)。
部分信息可能已经过时