Covariance)
反映随机变量之间依赖关系的一个数字特征
一、基本定义
协方差定义为:{(一个随机变量减去其期望) 乘以 (另一个随机变量减去其期望)} 的期望,实际上就是随机变量的函数的期望
若 的取值为 , 的取值为 ,联合概率为
并记 、,则二者的协方差是
这里必须使用联合概率 。两个变量各自的边缘概率只能给出各自均值和方差,不能决定“高于均值的 是否常常和高于均值的 同时出现”。
特别的,当 独立 时, ,所以协方差
协方差的数值大小受变量单位和量级的影响,因此它不是一个标准化的度量,受 本身度量单位的影响, 引出相关系数
二、协方差的性质
协方差与方差的关系:
当 独立时,
三、联合概率、独立与边界
协方差衡量的是中心化后的乘积平均值:若 与 经常同号,协方差为正;若经常异号,协方差为负;若正负抵消,则协方差为零。
当 独立时,,于是
所以独立一定推出零协方差。但零协方差只说明线性共同变化为零,并不一般推出独立。例如令 等概率取值,令 。此时 、,所以 ;但 完全由 决定,二者显然不独立。
公平硬币例子能看出联合概率的作用。若两个硬币分开抛,四个结果 的概率都为 ,两个变量独立,协方差为 。若两个硬币同面粘在一起,只可能出现 与 ,且概率各为 ,则 ,并且
此时 ,所以 ,达到最大正协方差。对应的二维协方差矩阵为
其行列式为 ,表示两个变量完全线性依赖,协方差矩阵是奇异的。
协方差的绝对值受两个标准差约束:
等号对应中心化变量几乎处处成线性比例;若某个变量方差为 ,它与任何变量的协方差都为 ,但这时不能再用相关系数衡量二者关系。
四、线性组合中的作用
协方差正是方差在加法下多出的交叉项。对两个有有限方差的变量,
因此正协方差会放大和的方差,负协方差会抵消一部分方差;当 独立时,交叉项消失。