一、统计量的定义#
设 X1,X2,⋯,Xn 是来自总体 X 的一个样本,g(X1,X2,⋯,Xn) 是样本 X1,X2,⋯,Xn 的函数,若g不含未知参数,则称 g(X1,X2,⋯,Xn)是一统计量。
二、常用统计量#
在统计学中,根据不同的目的可以构造出许多不同的统计量,下面是几个常用的重要统计量:
- 样本均值
X=n1i=1∑nXi
- 样本方差
S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)
- 样本标准差
S=S2=n−11i=1∑n(Xi−X)2
- 样本 k 阶 (原点) 矩
Ak=n1i=1∑nXik,k=1,2,⋯
- 样本 k 阶中心矩
Bk=n1i=1∑n(Xi−X)k,k=2,3,⋯当总体数字特征未知时(设各阶矩存在):
- 一般,用样本均值X作为总体均值μ=E(X)的估计。
- 用样本方差S2作为总体方差σ2=E(X−μ)2的估计。
- 用样本原点矩Ak作为总体原点矩μk=E(Xk)的估计。
- 用样本中心矩Bk作为总体中心矩νk=E(X−μ)k 的估计。
- 总体方差的估计可以用S2也可以B2,主要的区别涉及到“无偏性”,前者是无偏的后者是有偏的。
- 所有样本均值的平均值恰好是总体均值。(无偏性)
三、关于常用统计量的一些问题#
为什么样本方差要除以 n−1 ,而不是 n ?具体原因参考:自由度、无偏性与有偏性。
总体方差(σ2)和样本方差(s2)的定义:
-
总体方差:
σ2=N1i=1∑N(Xi−μ)2(除以总体大小N)
-
样本方差:
s2=n−11i=1∑n(Xi−Xˉ)2(除以n-1)
设X1,...,Xn是来自总体X∼(μ,σ2)的随机样本,证明E[s2]=σ2:
-
展开平方和:
∑(Xi−Xˉ)2=∑Xi2−nXˉ2
-
取期望:
E[∑(Xi−Xˉ)2]=∑E[Xi2]−nE[Xˉ2]
-
使用Var(Y)=E[Y2]−(E[Y])2:
- E[Xi2]=σ2+μ2
- E[Xˉ2]=Var(Xˉ)+(E[Xˉ])2=nσ2+μ2
-
代入得:
E[∑(Xi−Xˉ)2]=n(σ2+μ2)−n(nσ2+μ2)=(n−1)σ2
-
因此:
E[n−11∑(Xi−Xˉ)2]=σ2