矩阵

Matrix
矩阵是 mn 列的数表/矩形数组,在某些编程语言中称为 Array 。用于表示和处理线性变换、解线性方程组、计算向量空间中的各种运算。

A=(a11a12a1na21a22a2nam1am2amn)

一、基本运算

对矩阵进行运算实际上是对多维数据进行处理

加法

两个同型矩阵才能进行加法运算,定义为对应的元素相加

(A+B)ij=Aij+Bij

数乘

λ 与矩阵相乘,相当于矩阵的每一个元素与数 λ 相乘

乘法

矩阵乘法实现维数的转换,也即矩阵作用相当于线性变换

C(mn)=A(m×j)B(j×n)

矩阵乘法不满足交换律,左侧矩阵的列数与右侧矩阵行数相等时,才能相乘

转置

定义为 (AT)ij=Aji

(AT)t=A(AB)T=BTAT

参考:逆矩阵

注意

有的编程语言中存在 Broadcasting 机制,可以自动扩展运算不同维度的数组 (矩阵)

矩阵可交换乘法

  1. 单位矩阵:任何矩阵与单位矩阵相乘,结果仍然是原矩阵。单位矩阵可以看作是乘法的“交换”元素,因为对于任何矩阵 A,都有 AI=IA=AI=IA=A。
  2. 相同矩阵:如果两个矩阵 A 和 B 是相同的,那么 AB=BA。
  3. 对角矩阵:如果两个矩阵都是对角矩阵,并且它们的乘积也是对角矩阵,那么这两个对角矩阵的乘法是可交换的。
  4. 零矩阵:任何矩阵与零矩阵相乘,结果都是零矩阵,因此零矩阵在乘法下是“交换”的。
  5. 对称矩阵和斜对称矩阵:如果两个矩阵 AA 和 BB 都是对称矩阵或都是斜对称矩阵,并且它们的乘积仍然是对称矩阵或斜对称矩阵,那么在这种情况下,AB 和 BA 是相等的。

二、特殊的矩阵

若数值为 0 的元素数目远远多于非 0 元素的数目,并且非 0 元素分布没有规律时,则称该矩阵为稀疏矩阵;与之相反,若非 0 元素数目占大多数时,则称该矩阵为稠密矩阵。

单位矩阵

E=(100010001)

对角矩阵

Λ=diag(λ1,λ2,,λn)=(λ1000λ2000λn)

友矩阵

主对角线上方全为 1,最后一行的元素为任意值

Jordan 标准型

分块对角矩阵,每个 Jordan 块的主对角线为特征值,特征值右上一条对角线全为 1

以四阶举例:

J=(λ11000λ21000λ31000λ4)

矩阵多项式

n 阶矩阵 Am多项式

φ(A)=a1E+a2A++amAm

矩阵的幂可交换,多项式的乘积也可交换 φ(A)f(A)=f(A)φ(A)
所以关于 A 的多项式可以同实数的多项式一样相乘或分解因式

矩阵的迹 Tr


AI 结构化补充(2026-05-02)

Matrix
矩阵首先可以看成一个 mn 列的矩形数组,但在线性代数中更重要的是:矩阵表示一种把输入向量送到输出向量的线性动作。若

A=[a11a12a1na21a22a2nam1am2amn]Fm×n,

Am 行、n 列;条目 aij 的第一个下标 i 表示行,第二个下标 j 表示列。矩阵的形状决定它能作用在哪类向量上:m×n 矩阵乘 n 维列向量,输出 m 维列向量。

矩阵作为列组合动作

A 的列记为

A=[a1 a2  an],

其中每个 ajFm。对输入

x=[x1x2xn],

矩阵作用定义为

Ax=x1a1+x2a2++xnan.

因此 x 不是单纯被“套进公式”的数字,而是给 A 的各列指定权重;Ax 是这些列向量的线性组合。从这个角度看,所有可能的输出 Ax 构成 A列图像

例如

[123456][x1x2]=x1[135]+x2[246].

这说明 3×2 矩阵把二维输入系数送到三维输出向量。

同一个 Ax 的行点积读法

列组合读法解释输出从哪里来;行读法解释每个分量怎样算出来。若 A 的第 i 行为 riT,则

Ax=[r1Txr2TxrmTx].

也就是说,Ax 的第 i 个分量是第 i 行与 x点积。列组合给出几何图像,行点积给出方程约束;二者是同一个矩阵乘向量动作的两面,并连接到行图像

从 Ax 到 Ax=b

x 已知时,问题是正向计算:

b=Ax.

b 已知时,问题变成逆向寻找输入:

Ax=b.

这就是线性方程组矩阵形式。列组合图像问:b 是否落在 A 的列组合能够到达的范围内?行图像问:由各行给出的方程约束是否有公共交点?

A 是方阵并且可逆,则每个 b 都有唯一输入

x=A1b,

其中 A1 是撤销 A 动作的逆矩阵。这样的 A可逆矩阵。若 A 不可逆,则它是奇异矩阵;此时 Ax=b 可能无解,也可能有无穷多解,取决于 b 是否在列图像中以及零空间是否含有非零向量。

差分矩阵是动作的例子

矩阵可以把“求差”“累加”“循环求差”等操作写成统一的乘法。第一章常用的后向差分矩阵

A=[100110011]

把输入 x=(x1,x2,x3)T 送到

Ax=[x1x2x1x3x2].

例如 x=(1,4,9)T 时,Ax=(1,3,5)T。这个矩阵的逆动作是累加:从差分 b 恢复 x

循环差分矩阵则把首尾也相减:

C=[101110011].

它会把所有常数向量送到零向量,因此不能被唯一撤销;这正是“矩阵作为动作”比“矩阵作为数表”更有解释力的地方。

乘法与运算边界

矩阵乘法不是普通数乘的直接放大版。若 Am×nBn×p,则 AB 有定义且形状为 m×p;如果内侧维度不匹配,乘法没有意义。一般情况下

ABBA,

甚至 BA 可能根本没有定义。单位矩阵 I 满足 AI=AIA=A,同阶标量矩阵 cI 与所有同阶矩阵交换;除此之外,交换性必须由具体结构证明,不能作为默认规则使用。详细运算规则见矩阵乘法矩阵运算

常见特殊矩阵