Matrix
矩阵是 行 列的数表/矩形数组,在某些编程语言中称为 Array 。用于表示和处理线性变换、解线性方程组、计算向量空间中的各种运算。
一、基本运算
对矩阵进行运算实际上是对多维数据进行处理
加法
两个同型矩阵才能进行加法运算,定义为对应的元素相加
数乘
数 与矩阵相乘,相当于矩阵的每一个元素与数 相乘
乘法
矩阵乘法实现维数的转换,也即矩阵作用相当于线性变换
矩阵乘法不满足交换律,左侧矩阵的列数与右侧矩阵行数相等时,才能相乘
转置
定义为
逆
参考:逆矩阵
矩阵可交换乘法
- 单位矩阵:任何矩阵与单位矩阵相乘,结果仍然是原矩阵。单位矩阵可以看作是乘法的“交换”元素,因为对于任何矩阵 A,都有 AI=IA=AI=IA=A。
- 相同矩阵:如果两个矩阵 A 和 B 是相同的,那么 AB=BA。
- 对角矩阵:如果两个矩阵都是对角矩阵,并且它们的乘积也是对角矩阵,那么这两个对角矩阵的乘法是可交换的。
- 零矩阵:任何矩阵与零矩阵相乘,结果都是零矩阵,因此零矩阵在乘法下是“交换”的。
- 对称矩阵和斜对称矩阵:如果两个矩阵 AA 和 BB 都是对称矩阵或都是斜对称矩阵,并且它们的乘积仍然是对称矩阵或斜对称矩阵,那么在这种情况下,AB 和 BA 是相等的。
二、特殊的矩阵
若数值为 0 的元素数目远远多于非 0 元素的数目,并且非 0 元素分布没有规律时,则称该矩阵为稀疏矩阵;与之相反,若非 0 元素数目占大多数时,则称该矩阵为稠密矩阵。
单位矩阵
对角矩阵
友矩阵
主对角线上方全为 1,最后一行的元素为任意值
Jordan 标准型
分块对角矩阵,每个 Jordan 块的主对角线为特征值,特征值右上一条对角线全为 1
以四阶举例:
矩阵多项式
阶矩阵 的 次多项式:
矩阵的幂可交换,多项式的乘积也可交换
所以关于 的多项式可以同实数的多项式一样相乘或分解因式
矩阵的迹
AI 结构化补充(2026-05-02)
Matrix
矩阵首先可以看成一个 行 列的矩形数组,但在线性代数中更重要的是:矩阵表示一种把输入向量送到输出向量的线性动作。若
则 有 行、 列;条目 的第一个下标 表示行,第二个下标 表示列。矩阵的形状决定它能作用在哪类向量上: 矩阵乘 维列向量,输出 维列向量。
矩阵作为列组合动作
把 的列记为
其中每个 。对输入
矩阵作用定义为
因此 不是单纯被“套进公式”的数字,而是给 的各列指定权重; 是这些列向量的线性组合。从这个角度看,所有可能的输出 构成 的列图像。
例如
这说明 矩阵把二维输入系数送到三维输出向量。
同一个 Ax 的行点积读法
列组合读法解释输出从哪里来;行读法解释每个分量怎样算出来。若 的第 行为 ,则
也就是说, 的第 个分量是第 行与 的点积。列组合给出几何图像,行点积给出方程约束;二者是同一个矩阵乘向量动作的两面,并连接到行图像。
从 Ax 到 Ax=b
当 已知时,问题是正向计算:
当 已知时,问题变成逆向寻找输入:
这就是线性方程组的矩阵形式。列组合图像问: 是否落在 的列组合能够到达的范围内?行图像问:由各行给出的方程约束是否有公共交点?
若 是方阵并且可逆,则每个 都有唯一输入
其中 是撤销 动作的逆矩阵。这样的 是可逆矩阵。若 不可逆,则它是奇异矩阵;此时 可能无解,也可能有无穷多解,取决于 是否在列图像中以及零空间是否含有非零向量。
差分矩阵是动作的例子
矩阵可以把“求差”“累加”“循环求差”等操作写成统一的乘法。第一章常用的后向差分矩阵
把输入 送到
例如 时,。这个矩阵的逆动作是累加:从差分 恢复 。
循环差分矩阵则把首尾也相减:
它会把所有常数向量送到零向量,因此不能被唯一撤销;这正是“矩阵作为动作”比“矩阵作为数表”更有解释力的地方。
乘法与运算边界
矩阵乘法不是普通数乘的直接放大版。若 为 , 为 ,则 有定义且形状为 ;如果内侧维度不匹配,乘法没有意义。一般情况下
甚至 可能根本没有定义。单位矩阵 满足 和 ,同阶标量矩阵 与所有同阶矩阵交换;除此之外,交换性必须由具体结构证明,不能作为默认规则使用。详细运算规则见矩阵乘法与矩阵运算。
常见特殊矩阵
- 单位矩阵 保持输入不变,是乘法的恒等动作。
- 对角矩阵按坐标轴分别缩放。
- 三角矩阵常对应可按顺序求解的方程组。
- 稀疏矩阵只有少量非零条目,适合用结构化算法计算。
- 矩阵多项式 只涉及同一个方阵 的幂,因此这些幂彼此可交换;这不代表任意两个矩阵可交换。