554 字
3 分钟
中心极限定理

一、林德伯格-莱维中心极限定理 (Lindeberg-Lévy CLT)#

1、定理内容#

Xn{X_n}是独立同分布的随机变量序列,且满足:

  1. 期望存在:E[Xk]=μ<E[X_k] = \mu < \infty
  2. 方差存在:Var(Xk)=σ2<Var(X_k) = \sigma^2 < \infty (σ>0\sigma > 0)

则对于部分和Sn=k=1nXkS_n = \sum_{k=1}^n X_k,有标准化随机变量:

Zn=Snnμσn=Xnμσ/nZ_n = \frac{S_n - n\mu}{\sigma\sqrt{n}} = \frac{\overline{X}_n - \mu}{\sigma/\sqrt{n}}

nn \to \infty时,ZnZ_n依分布收敛于标准正态分布:

ZndN(0,1)Z_n \xrightarrow{d} N(0,1)

即对于任意实数zz

limnP(Znz)=Φ(z)=12πzet2/2dt\lim_{n \to \infty} P(Z_n \leq z) = \Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^z e^{-t^2/2} dt

2、意义说明#

  1. 普遍适用性:无论原始分布是什么形态(离散/连续,对称/偏态),只要满足i.i.d.和有限方差条件,标准化样本均值的分布都会收敛到正态分布。

  2. 样本量要求:实际应用中,n30n \geq 30通常被认为足以获得较好的近似效果,但对于高度偏态分布可能需要更大的nn

  3. 统计推断基础:为许多统计方法(如置信区间、假设检验)提供了理论依据,特别是当总体分布未知时。

  4. 误差解释:解释了为什么测量误差常呈正态分布(许多微小独立误差的叠加)。

二、棣莫弗-拉普拉斯中心极限定理 (De Moivre-Laplace CLT)#

1、定理内容#

Yn{Y_n}为独立伯努利随机变量序列,YkB(p)Y_k \sim B(p),其中0<p<10 < p < 1。记Sn=k=1nYkS_n = \sum_{k=1}^n Y_k为成功次数,则:

Zn=Snnpnp(1p)Z_n = \frac{S_n - np}{\sqrt{np(1-p)}}

nn \to \infty时,ZnZ_n依分布收敛于标准正态分布:

ZndN(0,1)Z_n \xrightarrow{d} N(0,1)

特别地,对于任意a<ba < b

limnP(aSnnpnp(1p)b)=Φ(b)Φ(a)\lim_{n \to \infty} P\left(a \leq \frac{S_n - np}{\sqrt{np(1-p)}} \leq b\right) = \Phi(b) - \Phi(a)

2、意义说明#

  1. 二项分布近似:这是历史上最早的中心极限定理形式(1733年),提供了用正态分布近似二项分布的理论依据。

  2. 实用准则:当np>5np > 5n(1p)>5n(1-p) > 5时,近似效果较好。当pp接近0.5时,近似所需nn更小。

  3. 离散修正:由于从离散分布近似连续分布,实际应用中常使用连续性修正: P(aSnb)Φ(b+0.5npnp(1p))Φ(a0.5npnp(1p))P(a \leq S_n \leq b) \approx \Phi\left(\frac{b+0.5-np}{\sqrt{np(1-p)}}\right) - \Phi\left(\frac{a-0.5-np}{\sqrt{np(1-p)}}\right)

  4. 分类数据分析:为比例检验、卡方检验等分类数据分析方法奠定了基础。

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

中心极限定理
https://www.laoguantx.cn/posts/centrallimittheorem/
作者
老官童鞋gogo
发布于
2025-05-15
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时

封面
Sample Song
Sample Artist
封面
Sample Song
Sample Artist
0:00 / 0:00