二次型

Quadratic Form

线性代数优化理论中非常重要

含有 n 个变量 x1,x2,,xn 的二次齐次函数称为二次型,若二次型只含有平方项,则称为标准二次型

f(x1,x2,,xn)=a11x12++annxn2+2a12x1x2++2an1,nxn1xn

aji=aij 即写为 2aijxixj=aijxixj+ajixjxi,并写为矩阵的形式:

f=a11x12++annxn2+a12x1x2+a21x2x1++an1,nxn1xn+an,n1xnxn1=x1(a11x1+a12x2++a1nxn)++xn(an1x1+an2x2++annxn)=(x1,x2,,xn)(a11a12a1na21a22a2nan1an2ann)(x1x2xn)=xTAx

A对称矩阵,称为二次型的矩阵

化为标准型

寻找可逆的线性变换 x=Cy 使得原二次型变为标准型

{x1=c11y1+c12y2++c1nynx2=c21y1+c22y2++c2nynxn=cn1y1+cn2y2++cnnynf=xTAx=(Cy)TACy=yT(CTAC)y=k1y12+k2y22++knyn2=(y1+y2++yn)(k1k2kn)(y1y2yn)

实际上就是矩阵对角化

能量与标准形

对实对称矩阵 S,二次型

xTSx

可以理解为由 S 定义的能量。正定矩阵要求所有非零 x 的能量为正;正半定矩阵则允许某些非零方向能量为零。

借助正交谱分解 S=QΛQT,令 x=Qy,可得标准形

xTSx=yTΛy=λ1y12++λnyn2.

因此二次型分类最终落到特征值符号:全正为正定,非负为正半定,既有正又有负为不定。

正定二次型的椭圆

S 是实对称正定矩阵,则方程

xTSx=1

在二维中给出以原点为中心的椭圆,在 n 维中给出椭球。由谱分解

S=QΛQT

并令 X=QTx,可化为主轴坐标下的标准形

XTΛX=λ1X12++λnXn2=1.

椭圆的轴方向由 S 的特征向量给出,半轴长为 1/λi;特征值越大,对应半轴越短。

例如

5x2+8xy+5y2=1

对应

S=(5445).

它的单位特征向量方向为

12(1,1)T,12(1,1)T,

特征值分别为 91。令

X=x+y2,Y=xy2,

5x2+8xy+5y2=9X2+Y2,

所以椭圆化为

9X2+Y2=1.

Hessian 与极小值判别

二次型也是多元函数二阶近似的核心。若函数 F 在某点一阶导数为零,则该点附近的主要变化由 Hessian 矩阵决定:

H=(FxxFxyFyxFyy).

H 正定时,二次主部 hTHh 在所有非零方向上为正,图像在该点附近像向上的碗,因此该临界点是局部极小点;当 H 不定时,不同方向上二次型符号相反,对应鞍点。三变量时 Hessian 扩展为

H=(FxxFxyFxzFyxFyyFyzFzxFzyFzz).