熵
Entropy 熵
刻画系统宏观状态所对应的不确定性、无序程度或可实现微观状态数的物理量,是连接热力学、统计物理与信息论的核心概念。
一、热力学定义
在经典热力学中,熵是表征系统状态的状态函数。对可逆过程,有
其中
这个定义表明,熵并不是简单的"混乱程度"口号,而是与热交换和可逆过程紧密相关的严格物理量。
二、统计力学解释
在统计物理中,玻尔兹曼公式给出熵的微观解释:
其中
更一般的 Gibbs 熵公式适用于非等概率分布:
其中
三、热力学第二定律与熵增
孤立系统的总熵不会自发减少,这就是热力学第二定律的典型表达:
| 过程类型 | 熵变 | 含义 |
|---|---|---|
| 可逆过程 | 系统与环境总熵不变 | |
| 不可逆过程 | 系统自发趋向更大概率的宏观状态 | |
| 绝热可逆 | 等熵过程 |
平衡态对应在给定约束下熵达到极大的状态,而非平衡态意味着系统内部仍存在流、梯度或持续交换过程。
四、信息熵
在信息论中,Shannon 信息熵刻画离散随机变量
单位为比特(bit)。若使用自然对数,则单位为纳特(nat)。
关键性质
,等号成立当且仅当 为确定性变量 - 离散均匀分布取到最大值
,等号成立当且仅当 独立
对连续随机变量,定义微分熵:
其中
五、重要推广
| 概念 | 定义 | 含义 |
|---|---|---|
| 联合熵 |
两个变量的总不确定性 | |
| 条件熵 |
已知 |
|
| 互信息 |
||
| KL 散度 |
分布 |
|
| 交叉熵 |
用分布 |
交叉熵与 KL 散度的关系
六、物理熵与信息熵的关系
二者形式上的相似并非偶然。令
Landauer 原理进一步揭示了物理联系:擦除 1 比特信息至少耗散能量
七、典型应用
- 热力学:判断过程方向、计算热机效率(卡诺循环)
- 统计物理:推导平衡分布(最大熵原理)
- 信息论:信道容量、数据压缩极限(Shannon 编码定理)
- 机器学习:交叉熵损失、决策树分裂准则、变分推断中的 ELBO
- 通信:信源编码、信道编码的理论下界