协方差

Covariance) Cov(X,Y

反映随机变量之间依赖关系的一个数字特征

一、基本定义

协方差定义为:{(一个随机变量减去其期望) 乘以 (另一个随机变量减去其期望)} 的期望,实际上就是随机变量的函数的期望

Cov(X,Y)=E{[XE(X)][YE(Y)]}=E(XY)E(X)E(Y)

X 的取值为 xiY 的取值为 yj,联合概率为

pij=P(X=xi,Y=yj),

并记 m1=E(X)m2=E(Y),则二者的协方差是

σ12=ijpij(xim1)(yjm2).

这里必须使用联合概率 pij。两个变量各自的边缘概率只能给出各自均值和方差,不能决定“高于均值的 X 是否常常和高于均值的 Y 同时出现”。

Cov(X,Y)=E[XY+E(X)E(Y)XE(Y)YE(X)]=E(XY)+E(X)E(Y)E(Y)E(X)E(X)E(Y)=E(XY)E(X)E(Y)

特别的,当 X,Y 独立 时, E(XY)=E(X)E(Y),所以协方差 Cov(X,Y)=0

协方差的数值大小受变量单位和量级的影响,因此它不是一个标准化的度量,受 X,Y 本身度量单位的影响, 引出相关系数 ρXY

ρXY=Cov(X,Y)D(X)D(Y)Cov(X,Y)=ρXYD(X)D(Y)

二、协方差的性质

Cov(X,X)=D(X)Cov(X,Y)=Cov(Y,X)Cov(aX,bY)=abCov(X,Y)Cov(C,X)=0CCov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

协方差与方差的关系:

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

X,Y 独立时,D(X+Y)=D(X)+D(Y)

Cov(X1+X2,Y1+Y2)=Cov(X1,Y1+Y2)+Cov(X2,Y1+Y2)=Cov(X1,Y1)+Cov(X1,Y2)+Cov(X2,Y1)+Cov(X2,Y2)

三、联合概率、独立与边界

协方差衡量的是中心化后的乘积平均值:若 Xm1Ym2 经常同号,协方差为正;若经常异号,协方差为负;若正负抵消,则协方差为零。

X,Y 独立时,pij=piPj,于是

σ12=ijpiPj(xim1)(yjm2)=[ipi(xim1)][jPj(yjm2)]=0.

所以独立一定推出零协方差。但零协方差只说明线性共同变化为零,并不一般推出独立。例如令 X{1,0,1} 等概率取值,令 Y=X2。此时 E(X)=0E(XY)=E(X3)=0,所以 Cov(X,Y)=0;但 Y 完全由 X 决定,二者显然不独立。

公平硬币例子能看出联合概率的作用。若两个硬币分开抛,四个结果 (1,1),(1,0),(0,1),(0,0) 的概率都为 14,两个变量独立,协方差为 0。若两个硬币同面粘在一起,只可能出现 (1,1)(0,0),且概率各为 12,则 m1=m2=12,并且

σ12=12(112)2+12(012)2=14.

此时 σ1=σ2=12,所以 σ12=σ1σ2,达到最大正协方差。对应的二维协方差矩阵为

Vglue=[σ12σ1σ2σ1σ2σ22]=[14141414],

其行列式为 0,表示两个变量完全线性依赖,协方差矩阵是奇异的。

协方差的绝对值受两个标准差约束:

|σ12|σ1σ2.

等号对应中心化变量几乎处处成线性比例;若某个变量方差为 0,它与任何变量的协方差都为 0,但这时不能再用相关系数衡量二者关系。

四、线性组合中的作用

协方差正是方差在加法下多出的交叉项。对两个有有限方差的变量,

Var(x+y)=σx2+σy2+2σxy.

因此正协方差会放大和的方差,负协方差会抵消一部分方差;当 x,y 独立时,交叉项消失。