3、协方差的性质#
(1)对任意的正整数n(n⩾2),设X1,X2,⋯,Xn为方差存在的随机变量,则X1+X2+⋯+Xn的方差也存在,且:
Var(i=1∑nXi)=i=1∑nVar(Xi)+21⩽i<j⩽n∑Cov(Xi,Xj)(2)Cov(X,Y)=Cov(Y,X)
(3)Cov(X,X)=Var(X)
(4)Cov(aX,bY)=abCov(X,Y), 其中 a,b 为两个实数
(5)若 Cov(Xi,Y)(i=1,2) 存在, 则:
Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)(6)若 X 和 Y 相互独立, 则 Cov(X,Y)=0, 但反之不然
(7)当 Var(X)⋅Var(Y)=0 时, 有 :
(Cov(X,Y))2⩽Var(X)Var(Y)其中等号成立当且仅当 X 与 Y 之间有严格的线性关系(即存在常数 c1,c2 使得 P{Y=c1+c2X}=1 成立)。
下面证明性质(7):
考虑一个实数 t,构造随机变量 Z=(X−E[X])+t(Y−E[Y])。计算 Z 的方差:
Var(Z)=E[Z2]=E[((X−E[X])+t(Y−E[Y]))2]
展开平方项:
Var(Z)=E[(X−E[X])2]+2tE[(X−E[X])(Y−E[Y])]+t2E[(Y−E[Y])2]
用协方差和方差的定义表示:
Var(Z)=Var(X)+2tCov(X,Y)+t2Var(Y)
由于方差始终非负,即 Var(Z)≥0 对所有实数 t 成立,因此二次式:
Var(X)+2tCov(X,Y)+t2Var(Y)≥0
这是一个关于 t 的二次不等式,其判别式必须非正:
(2Cov(X,Y))2−4⋅Var(X)⋅Var(Y)≤0
化简判别式:
4(Cov(X,Y))2−4Var(X)Var(Y)≤0
两边除以 4:
(Cov(X,Y))2≤Var(X)Var(Y)
这就是需要证明的不等式。
等号成立当且仅当判别式等于零,即:
(Cov(X,Y))2=Var(X)Var(Y)
此时,二次方程 Var(Z)=0 有唯一实数解 t=−Var(Y)Cov(X,Y)(假设 Var(Y)=0)。这意味着:
Z=(X−E[X])+t(Y−E[Y])=0几乎处处成立
即:
X−E[X]=−Var(Y)Cov(X,Y)(Y−E[Y])
这表明 X 和 Y 之间存在严格的线性关系:
X=c1+c2Y
其中 c1=E[X]−Var(Y)Cov(X,Y)E[Y],c2=−Var(Y)Cov(X,Y)。
类似地,如果 Var(X)=0,可以表示为 Y=c1′+c2′X。因此,等号成立当且仅当 X 和 Y 之间存在严格的线性关系。
而这个性质,也为后面的相关系数的引出奠定基础。
(8)对任意的k=1,2,⋯,n,有
Cov(Xˉ,Xk)=Cov(n1i=1∑nXi,Xk)=n1i=1∑nCov(Xi,Xk)