一、离散型随机变量分布列#
离散型随机变量的分布列是指随机变量取各个可能值的概率列表。设离散型随机变量 X 的可能取值为 x1,x2,…,xn,则其分布列为:
P(X=xi)=pi,i=1,2,…,n其中 pi≥0 且 ∑i=1npi=1。
1. 0-1 分布(伯努利分布)#
0-1 分布是描述只有两种可能结果的单次试验的分布。设随机变量 X 表示试验结果,X=1 表示“成功”,X=0 表示“失败”,则其分布列为:
P(X=k)=pk(1−p)1−k,k=0,1其中 p 是“成功”的概率,0<p<1。
2. 二项分布#
二项分布描述在 n 重伯努利试验中“成功”次数的分布。设随机变量 X 表示在 n 次独立试验中“成功”的次数,则 X 服从参数为 n 和 p 的二项分布,记作:
X∼B(n,p)其分布列为:
P(X=k)=Cnkpk(1−p)n−k,k=0,1,…,n其中:
- p 是每次试验“成功”的概率,0<p<1。
3. 超几何分布#
超几何分布描述在不放回抽样的情况下,具有特定属性的个体数量的分布。设总体中有 N 个个体,其中 a 个具有特定属性,随机抽取 n 个个体,X 表示其中具有特定属性的个体数量,则 X 服从超几何分布,记作:
X∼H(n,a,N)其分布列为:
P(X=k)=CNnCakCN−an−k,k=max{0,n−(N−a)},…,min{a,n}其中:
- Cak 表示从 a 个具有特定属性的个体中选出 k 个的组合数;
- CN−an−k 表示从 N−a 个不具有特定属性的个体中选出 n−k 个的组合数;
- CNn 表示从总体 N 个个体中选出 n 个的组合数。
4. 几何分布#
几何分布描述在伯努利试验中首次“成功”所需的试验次数的分布。设随机变量 X 表示首次“成功”发生的试验次数,则 X 服从参数为 p 的几何分布,记作:
X∼Geom(p)其分布列为:
P(X=k)=(1−p)k−1p,k=1,2,…其中 p 是每次试验“成功”的概率,0<p<1。
5. 负二项分布(帕斯卡分布)#
负二项分布描述在伯努利试验中达到指定次数“成功”所需的试验次数的分布。设随机变量 X 表示第 r 次“成功”发生时的试验次数,则 X 服从参数为 r 和 p 的负二项分布,记作:
X∼NB(r,p)其分布列为:
P(X=k)=Ck−1r−1pr(1−p)k−r,k=r,r+1,…其中:
- p 是每次试验“成功”的概率,0<p<1。
6. 泊松分布#
泊松分布描述在单位时间或单位空间内某事件发生次数的分布。设随机变量 X 表示在单位时间或单位空间内事件发生的次数,则 X 服从参数为 λ(事件发生的平均速率)的泊松分布,记作:
X∼P(λ)其分布列为:
P(X=k)=k!λke−λ,k=0,1,2,…其中:
- λ>0 是单位时间或单位空间内事件发生的平均次数;
- e 是自然对数的底数(约等于 2.71828)。
二、 连续型随机变量概率密度函数#
设 X 是一个连续型随机变量,其概率密度函数(PDF)为 f(x),满足:
- f(x)≥0 对所有 x 成立;
- ∫−∞∞f(x)dx=1;
- 对任意实数 a≤b,X 落在区间 [a,b] 内的概率为:
P(a≤X≤b)=∫abf(x)dx其分布函数记作:
F(x)=∫−∞xf(x)dx
1. 均匀分布#
若连续型随机变量 X 在区间 [a,b] 上服从均匀分布,记作 X∼U(a,b),其概率密度函数为:
f(x)=⎩⎨⎧b−a1,0,a≤x≤b,其他.
2. 正态分布#
若连续型随机变量 X 服从参数为 μ(均值)和 σ2(方差)的正态分布,记作 X∼N(μ,σ2),其概率密度函数为:
f(x)=2πσ1e−2σ2(x−μ)2,−∞<x<∞.特别地,若 μ=0,σ2=1,记作 X∼N(0,1),概率密度函数为:
f(x)=2π1e−2x2,−∞<x<∞.则称连续型随机变量 X 服从标准正态分布。
3. 指数分布#
若连续型随机变量 X 服从参数为 λ(率参数)的指数分布,记作 X∼Exp(λ),其概率密度函数为:
f(x)={λe−λx,0,x≥0,x<0.
4. Gamma 分布#
若连续型随机变量 X 服从参数为 α(形状参数)和 β(率参数)的 Gamma 分布,记作 X∼Γ(α,β),其概率密度函数为:
f(x)=⎩⎨⎧Γ(α)βαxα−1e−βx=Γ(α)βe−λx(βx)α−1,0,x≥0,x<0.其中 Γ(α) 定义为:
Γ(α)=∫0∞tα−1e−tdt
5. 二参数威布尔分布#
若连续型随机变量 X 服从参数为 λ(尺度参数)和 k(形状参数)的威布尔分布,记作 X∼Weibull(λ,k),其概率密度函数为:
f(x)={λk(λx)k−1e−(x/λ)k,0,x≥0,x<0.
6. β 分布#
若连续型随机变量 X 服从参数为 α 和 β 的 β 分布,记作 X∼β(α,β),其概率密度函数为:
f(x)=⎩⎨⎧B(α,β)xα−1(1−x)β−1=Γ(a)Γ(b)Γ(a+b)xα−1(x−1)β−1,0,0≤x≤1,其他.其中 B(α,β) 是β函数,定义为:
B(α,β)=∫01tα−1(1−t)β−1dt