Variance)
是衡量随机变量或一组数据离散程度的度量,它描述了数据点与其平均值(期望值)的偏差平方的平均值。
方差提供了数据分布的波动或分散程度的信息。
刻画随机变量取值 与数学期望的离散程度
- 若 的取值较为集中,则方差较小
- 若 的取值较为分散,则方差较大
一、基本定义
方差定义为:
将方差开根号定义为标准差/均方差:
方差公式:使用随机变量平方的期望减去期望的平方
二、一般的计算
1. 离散型随机变量
概率分布律
2. 连续型随机变量
概率密度为
三、基本性质
- 为常数,则
- 为随机变量,则:
最后一项实际为协方差,若 相互独立,则进一步可简化为:
证明见: 切比雪夫不等式
标准化变量
随机变量有数学期望 方差 ,记
特殊分布的方差
分布函数
AI 结构化补充(2026-05-02)
Variance)
是衡量随机变量或一组数据离散程度的度量,它描述了数据点与其平均值(期望值)的偏差平方的平均值。
方差提供了数据分布的波动或分散程度的信息。
刻画随机变量取值 与数学期望的离散程度
- 若 的取值较为集中,则方差较小
- 若 的取值较为分散,则方差较大
一、基本定义
方差定义为:
将方差开根号定义为标准差/均方差:
方差公式:使用随机变量平方的期望减去期望的平方
二、一般的计算
1. 离散型随机变量
概率分布律
2. 连续型随机变量
概率密度为
三、基本性质
- 为常数,则
- 为随机变量,则:
最后一项实际为协方差,若 相互独立,则进一步可简化为:
证明见: 切比雪夫不等式
标准化变量
随机变量有数学期望 方差 ,记
特殊分布的方差
分布函数
样本方差、概率方差与计算恒等式
方差的共同思想是“离均值距离的平方平均”,但样本数据和概率模型对应的公式不同。
样本 的样本均值为
样本方差通常写作
这里除以 而不是 ,是因为 已经由同一批样本估计出来,消耗了一个自由度;在独立同分布抽样下,这样的 是总体方差 的无偏估计。
例如样本年龄为 ,样本均值
所以
计算样本方差时常用恒等式
其中最后一步用了 。它说明平方离差和可以由平方和与均值直接得到。
若概率已知,方差围绕期望 计算:
连续变量则为
例如新生年龄为 的概率分别是 ,期望年龄为
概率方差为
因此标准差为
标准化与零方差边界
若随机变量有均值 、标准差 ,可以定义标准化变量
使 、。这一步要求 严格大于 。
当 时,随机变量几乎处处等于它的均值,没有离散程度。此时 会除以 ,不能直接定义。类似地,相关系数
也要求 且 ;只要其中一个标准差为 ,相关系数就不能按这个公式直接计算。