方差

Variance) $D (X$
是衡量随机变量或一组数据离散程度的度量，它描述了数据点与其平均值（期望值）的偏差平方的平均值。
方差提供了数据分布的波动或分散程度的信息。

刻画随机变量取值 $X$ 与数学期望的离散程度

若 $X$ 的取值较为集中，则方差较小
若 $X$ 的取值较为分散，则方差较大

一、基本定义

方差定义为：

D (X) = E [(X - E (X))^{2}]

将方差开根号定义为标准差/均方差： $\sqrt{D (X)}$

方差公式：使用随机变量平方的期望减去期望的平方

\begin{array}{r} D (X) = E (X^{2}) - (E (X))^{2} \end{array}

\begin{aligned} D (X) & = E [X^{2} + E (X)^{2} - 2 X E (X)] \\ = E (X^{2}) + E (X)^{2} - 2 E (X) E (X) \\ = E (X^{2}) - E (X)^{2} \end{aligned}

二、一般的计算

1. 离散型随机变量

概率分布律 $P {X = x_{i}} = p_{i} i = 1, 2, 3, \dots$

\begin{array}{r} D (X) = \sum_{i = 1}^{\infty} (x_{i} - E (X))^{2} \cdot p_{i} \end{array}

2. 连续型随机变量

概率密度为 $f (x)$

\begin{array}{r} D (X) = \int_{- \infty}^{+ \infty} {[x_{i} - E (X)]}^{2} f (x) d x \end{array}

三、基本性质

$C$ 为常数，则 $D (C) = 0$
$D (C X) = C^{2} D (X)$
$X, Y$ 为随机变量，则：

\begin{array}{r} D (a X \pm b Y) = a^{2} D (X) + b^{2} D (Y) \pm 2 a b E {[X - E (X)] [Y - E (Y)]} \end{array}

最后一项实际为协方差，若 $X, Y$ 相互独立，则进一步可简化为：

\begin{array}{r} D (a X \pm b Y) = a^{2} D (X) + b^{2} D (Y) \end{array}

$D (X) = 1 \Leftrightarrow P {X = E (X)} = 1$
证明见：切比雪夫不等式

\begin{aligned} D (a X \pm b Y) & = E {[a X + b Y - (a E X + b E Y)]}^{2} \\ = E [a (X - E (X)) + b (Y - E (Y))]^{2} \\ = a^{2} E (X - E (X))^{2} + b^{2} E (Y - E (Y))^{2} + 2 a b E [(X - E (X)) (Y - E (Y))] \\ = a^{2} D (X) + b^{2} D (Y) + 2 a b C o v (X, Y) \end{aligned}

标准化变量

随机变量有数学期望 $E (X) = μ$ 方差 $D (X) = σ^{2}$ ，记 $X^{*} = \frac{X - μ}{σ}$

\begin{array}{r} X^{*} = \frac{X - E (X)}{\sqrt{D (X)}} \end{array}

$E (X^{*}) = \frac{1}{σ} [E (X) - μ] = 0$

$D (X^{*}) = \frac{1}{σ^{2}} E [(X - μ)^{2}] = \frac{σ^{2}}{σ^{2}} = 1$

特殊分布的方差

分布函数

\begin{array}{r} \int_{- \infty}^{+ \infty} x^{2} \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}} d x = E (X^{2}) = 1 \end{array}

AI 结构化补充（2026-05-02）

刻画随机变量取值 $X$ 与数学期望的离散程度

若 $X$ 的取值较为集中，则方差较小
若 $X$ 的取值较为分散，则方差较大

一、基本定义

方差定义为：

D (X) = E [(X - E (X))^{2}]

将方差开根号定义为标准差/均方差： $\sqrt{D (X)}$

方差公式：使用随机变量平方的期望减去期望的平方

\begin{array}{r} D (X) = E (X^{2}) - (E (X))^{2} \end{array}

\begin{aligned} D (X) & = E [X^{2} + E (X)^{2} - 2 X E (X)] \\ = E (X^{2}) + E (X)^{2} - 2 E (X) E (X) \\ = E (X^{2}) - E (X)^{2} \end{aligned}

二、一般的计算

1. 离散型随机变量

概率分布律 $P {X = x_{i}} = p_{i} i = 1, 2, 3, \dots$

\begin{array}{r} D (X) = \sum_{i = 1}^{\infty} (x_{i} - E (X))^{2} \cdot p_{i} \end{array}

2. 连续型随机变量

概率密度为 $f (x)$

\begin{array}{r} D (X) = \int_{- \infty}^{+ \infty} {[x - E (X)]}^{2} f (x) d x \end{array}

三、基本性质

$C$ 为常数，则 $D (C) = 0$
$D (C X) = C^{2} D (X)$
$X, Y$ 为随机变量，则：

\begin{array}{r} D (a X \pm b Y) = a^{2} D (X) + b^{2} D (Y) \pm 2 a b E {[X - E (X)] [Y - E (Y)]} \end{array}

最后一项实际为协方差，若 $X, Y$ 相互独立，则进一步可简化为：

\begin{array}{r} D (a X \pm b Y) = a^{2} D (X) + b^{2} D (Y) \end{array}

$D (X) = 0 \Leftrightarrow P {X = E (X)} = 1$
证明见：切比雪夫不等式

\begin{aligned} D (a X \pm b Y) & = E {[a X + b Y - (a E X + b E Y)]}^{2} \\ = E [a (X - E (X)) + b (Y - E (Y))]^{2} \\ = a^{2} E (X - E (X))^{2} + b^{2} E (Y - E (Y))^{2} + 2 a b E [(X - E (X)) (Y - E (Y))] \\ = a^{2} D (X) + b^{2} D (Y) + 2 a b C o v (X, Y) \end{aligned}

标准化变量

随机变量有数学期望 $E (X) = μ$ 方差 $D (X) = σ^{2}$ ，记 $X^{*} = \frac{X - μ}{σ}$

\begin{array}{r} X^{*} = \frac{X - E (X)}{\sqrt{D (X)}} \end{array}

$E (X^{*}) = \frac{1}{σ} [E (X) - μ] = 0$

$D (X^{*}) = \frac{1}{σ^{2}} E [(X - μ)^{2}] = \frac{σ^{2}}{σ^{2}} = 1$

特殊分布的方差

分布函数

\begin{array}{r} \int_{- \infty}^{+ \infty} x^{2} \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}} d x = E (X^{2}) = 1 \end{array}

样本方差、概率方差与计算恒等式

方差的共同思想是“离均值距离的平方平均”，但样本数据和概率模型对应的公式不同。

样本 $x_{1}, \dots, x_{N}$ 的样本均值为

m = \frac{x_{1} + \dots + x_{N}}{N} .

样本方差通常写作

S^{2} = \frac{1}{N - 1} \sum_{i = 1}^{N} (x_{i} - m)^{2} .

这里除以 $N - 1$ 而不是 $N$ ，是因为 $m$ 已经由同一批样本估计出来，消耗了一个自由度；在独立同分布抽样下，这样的 $S^{2}$ 是总体方差 $σ^{2}$ 的无偏估计。

例如样本年龄为 $18, 17, 18, 19, 17$ ，样本均值

m = \frac{18 + 17 + 18 + 19 + 17}{5} = 17.8 .

所以

\begin{aligned} S^{2} & = \frac{1}{4} [(.2)^{2} + (- .8)^{2} + (.2)^{2} + (1.2)^{2} + (- .8)^{2}] \\ = \frac{2.8}{4} = 0.7 . \end{aligned}

计算样本方差时常用恒等式

\sum_{i = 1}^{N} (x_{i} - m)^{2} = \sum_{i = 1}^{N} x_{i}^{2} - 2 m \sum_{i = 1}^{N} x_{i} + N m^{2} = \sum_{i = 1}^{N} x_{i}^{2} - N m^{2},

其中最后一步用了 $\sum_{i} x_{i} = N m$ 。它说明平方离差和可以由平方和与均值直接得到。

若概率已知，方差围绕期望 $m = E [x]$ 计算：

σ^{2} = E [(x - m)^{2}] = \sum_{i = 1}^{n} p_{i} (x_{i} - m)^{2} .

连续变量则为

σ^{2} = \int_{- \infty}^{\infty} (x - m)^{2} p (x) d x .

例如新生年龄为 $17, 18, 19$ 的概率分别是 $.2, .5, .3$ ，期望年龄为

m = (.2) 17 + (.5) 18 + (.3) 19 = 18.1 .

概率方差为

\begin{aligned} σ^{2} & = (.2) (17 - 18.1)^{2} + (.5) (18 - 18.1)^{2} + (.3) (19 - 18.1)^{2} \\ = (.2) (1.21) + (.5) (.01) + (.3) (.81) = .49 . \end{aligned}

因此标准差为

σ = \sqrt{.49} = .7 .

标准化与零方差边界

若随机变量有均值 $μ$ 、标准差 $σ > 0$ ，可以定义标准化变量

X^{*} = \frac{X - μ}{σ},

使 $E (X^{*}) = 0$ 、 $D (X^{*}) = 1$ 。这一步要求 $σ$ 严格大于 $0$ 。

当 $σ = 0$ 时，随机变量几乎处处等于它的均值，没有离散程度。此时 $X^{*} = (X - μ) / σ$ 会除以 $0$ ，不能直接定义。类似地，相关系数

ρ_{X Y} = \frac{Cov (X, Y)}{σ_{X} σ_{Y}}

也要求 $σ_{X} > 0$ 且 $σ_{Y} > 0$ ；只要其中一个标准差为 $0$ ，相关系数就不能按这个公式直接计算。