Chapter 08
特征方程、特征空间、对角化与矩阵的幂
对于 n×n 方阵 A,若存在标量 λ 和非零向量 v,使得:
则称 λ 为 A 的特征值(eigenvalue),v 为对应的特征向量(eigenvector)。
特征向量是在线性变换 A 下"只被拉伸、不被旋转"的特殊方向。特征值 λ 就是这个拉伸的比例因子:|λ| > 1 表示拉伸,|λ| < 1 表示压缩,λ < 0 表示反向。
将 Av = λv 改写为 (A - λI)v = 0。该齐次方程有非零解的充要条件是系数矩阵奇异:
这个关于 λ 的 n 次多项式方程称为特征方程(characteristic equation),其根即为特征值。
p(λ) = det(A - λI) 是 n 次多项式。由代数基本定理,n×n 矩阵在复数域上恰有 n 个特征值(计入重数)。特征值的和等于迹(trace):λ₁ + λ₂ + ... + λₙ = tr(A);特征值的积等于行列式:λ₁λ₂...λₙ = det(A)。
对应于特征值 λ 的特征空间(eigenspace)是所有满足 Av = λv 的向量构成的子空间,即 Nul(A - λI)。其维数称为特征值 λ 的几何重数。
特征值的代数重数是它在特征多项式中作为根的重数。总有:几何重数 ≤ 代数重数。
若 n×n 矩阵 A 有 n 个线性无关的特征向量,则 A 可对角化(diagonalizable)。此时存在可逆矩阵 P 和对角矩阵 D,使得:
其中 P 的列是 A 的特征向量,D 的对角元是对应的特征值。
以下任一条件都保证 A 可对角化:
对角化的最大威力在于简化矩阵多项式计算。若 A = PDP⁻¹,则:
由于 D 是对角矩阵,Dᵏ 只需将对角元分别取 k 次幂即可。这使得计算 A¹⁰⁰ 等操作变得异常简单。
对角化意味着我们可以找到一组基(特征向量基),使得线性变换在这组基下的表示矩阵是对角阵。这是对变换的"最简描述"——每个基向量只被缩放,没有耦合。
对每个特征值 λᵢ:
机械系统和建筑结构的振动由特征值问题主导。质量-弹簧系统的运动方程经离散化后形式为 Mv'' + Kv = 0,其中 M 是质量矩阵,K 是刚度矩阵。设 v = e^(iωt)u,则得到广义特征值问题 Ku = ω²Mu。特征值 ω² 的平方根即为系统的固有频率,特征向量 u 描述对应的振型(mode shape)。避免共振的关键就是使外部激励频率远离结构的固有频率。
PCA 的核心是对数据协方差矩阵 C 进行特征值分解。协方差矩阵是对称半正定的,其特征向量是数据方差最大的方向(主成分),特征值表示该方向上的方差大小。将数据投影到前 k 个最大特征值对应的特征向量上,即实现降维与去噪。
Google 的 PageRank 算法将网页链接结构建模为马尔可夫链的转移矩阵 P。寻找网页的重要性排名等价于求 P 的稳态分布,即对应于特征值 1 的左特征向量。PageRank 的收敛速度由第二大特征值的模决定,这解释了为什么某些链接结构需要更多次迭代才能稳定。
线性动力系统 dx/dt = Ax 的稳定性完全由 A 的特征值决定:若所有特征值实部均小于 0,则系统渐近稳定;若任一特征值实部大于 0,则不稳定。离散系统 x_{k+1} = Ax_k 的稳定性要求所有特征值的模均小于 1。这一判据广泛应用于机器人控制、生态种群模型和经济预测。
在量子力学中,物理可观测量对应厄米算符(复数域上的对称矩阵),其特征值即为该物理量可能的测量结果,特征向量对应量子态。薛定谔方程 iℏ∂ψ/∂t = Hψ 的形式解 ψ(t) = e^(-iHt/ℏ)ψ(0) 正是通过哈密顿量 H 的特征值分解得到的。
求矩阵 A 的特征值和特征向量:
特征方程 det(A - λI) = 0:
解得:(λ - 5)(λ - 2) = 0,故 λ₁ = 5, λ₂ = 2。
对 λ₁ = 5,解 (A - 5I)v = 0:
得 x = 2y,取 v₁ = (2, 1)ᵀ。
对 λ₂ = 2,解 (A - 2I)v = 0:
得 x = -y,取 v₂ = (1, -1)ᵀ(或 (-1, 1)ᵀ)。
判断矩阵 A 是否可对角化,若可对角化,求 P 和 D 使得 A = PDP⁻¹:
由例题 8.1,A 有两个不同的特征值 5 和 2,故必可对角化。
取 P = [v₁ v₂] = [ 2 1 ], D = [ 5 0 ]。
[ 1 -1 ] [ 0 2 ]
验证 det(P) = -3 ≠ 0,P 可逆。
计算 P⁻¹ = (1/-3)[ -1 -1 ] = [ 1/3 1/3 ]
[ -1 2 ] [ 1/3 -2/3 ]
验证 PDP⁻¹:
PD = [ 2 1 ][ 5 0 ] = [ 10 2 ]
[ 1 -1 ][ 0 2 ] [ 5 -2 ]
PDP⁻¹ = [ 10 2 ][ 1/3 1/3 ] = [ 4 2 ] = A
[ 5 -2 ][ 1/3 -2/3 ] [ 1 3 ]
计算 A¹⁰⁰,其中 A = [4 2; 1 3]。
由对角化 A = PDP⁻¹,有 A¹⁰⁰ = PD¹⁰⁰P⁻¹。
D¹⁰⁰ = [ 5¹⁰⁰ 0 ]
[ 0 2¹⁰⁰ ]
A¹⁰⁰ = [ 2 1 ][ 5¹⁰⁰ 0 ][ 1/3 1/3 ]
[ 1 -1 ][ 0 2¹⁰⁰ ][ 1/3 -2/3 ]
先计算 PD¹⁰⁰ = [ 2·5¹⁰⁰ 2¹⁰⁰ ]
[ 5¹⁰⁰ -2¹⁰⁰ ]
再与 P⁻¹ 相乘:
A¹⁰⁰₁₁ = (2·5¹⁰⁰ + 2¹⁰⁰)/3, A¹⁰⁰₁₂ = (2·5¹⁰⁰ - 2·2¹⁰⁰)/3
A¹⁰⁰₂₁ = (5¹⁰⁰ - 2¹⁰⁰)/3, A¹⁰⁰₂₂ = (5¹⁰⁰ + 2·2¹⁰⁰)/3
判断下列矩阵是否可对角化:
A 是上三角矩阵,特征值即对角元:λ₁ = 2(代数重数 2),λ₂ = 3(代数重数 1)。
对 λ₁ = 2,求 Nul(A - 2I):
RREF 为 [ 0 1 0; 0 0 1; 0 0 0 ],主元列 2,3,自由变量 x₁。
零空间维数 = 1,即 λ=2 的几何重数为 1。
由于几何重数(1) < 代数重数(2),A 不可对角化。
MATLAB 命令行输出如下: