Chapter 08

特征值与特征向量

特征方程、特征空间、对角化与矩阵的幂

01

核心概念

特征值与特征向量的定义

对于 n×n 方阵 A,若存在标量 λ 和非零向量 v,使得:

Av = λv

则称 λ 为 A 的特征值(eigenvalue),v 为对应的特征向量(eigenvector)。

几何直觉

特征向量是在线性变换 A 下"只被拉伸、不被旋转"的特殊方向。特征值 λ 就是这个拉伸的比例因子:|λ| > 1 表示拉伸,|λ| < 1 表示压缩,λ < 0 表示反向。

特征方程

将 Av = λv 改写为 (A - λI)v = 0。该齐次方程有非零解的充要条件是系数矩阵奇异:

det(A - λI) = 0

这个关于 λ 的 n 次多项式方程称为特征方程(characteristic equation),其根即为特征值。

特征多项式

p(λ) = det(A - λI) 是 n 次多项式。由代数基本定理,n×n 矩阵在复数域上恰有 n 个特征值(计入重数)。特征值的和等于迹(trace):λ₁ + λ₂ + ... + λₙ = tr(A);特征值的积等于行列式:λ₁λ₂...λₙ = det(A)。

特征空间

对应于特征值 λ 的特征空间(eigenspace)是所有满足 Av = λv 的向量构成的子空间,即 Nul(A - λI)。其维数称为特征值 λ 的几何重数

特征值的代数重数是它在特征多项式中作为根的重数。总有:几何重数 ≤ 代数重数。

对角化条件

若 n×n 矩阵 A 有 n 个线性无关的特征向量,则 A 可对角化(diagonalizable)。此时存在可逆矩阵 P 和对角矩阵 D,使得:

A = PDP⁻¹

其中 P 的列是 A 的特征向量,D 的对角元是对应的特征值。

可对角化的充分条件

以下任一条件都保证 A 可对角化:

  • A 有 n 个互不相同的特征值。
  • A 是对称矩阵(A = Aᵀ),此时 P 可取为正交矩阵。
  • 每个特征值的几何重数等于代数重数。

矩阵的幂

对角化的最大威力在于简化矩阵多项式计算。若 A = PDP⁻¹,则:

Aᵏ = PDᵏP⁻¹

由于 D 是对角矩阵,Dᵏ 只需将对角元分别取 k 次幂即可。这使得计算 A¹⁰⁰ 等操作变得异常简单。

对角化的本质

对角化意味着我们可以找到一组基(特征向量基),使得线性变换在这组基下的表示矩阵是对角阵。这是对变换的"最简描述"——每个基向量只被缩放,没有耦合。

02

计算方法

求特征值

  1. 构造特征矩阵 A - λI。
  2. 计算特征多项式 p(λ) = det(A - λI)。
  3. 解方程 p(λ) = 0,得到特征值 λ₁, λ₂, ..., λₙ。

求特征向量

对每个特征值 λᵢ:

  1. 解齐次线性方程组 (A - λᵢI)v = 0。
  2. 零空间 Nul(A - λᵢI) 中的非零向量即为特征向量。
  3. 通常选取一组基作为该特征空间的代表特征向量。

判断可对角化

  1. 求出所有特征值及其代数重数。
  2. 对每个特征值,求其几何重数 dim Nul(A - λI)。
  3. 若所有几何重数之和等于 n,则 A 可对角化。
  4. 构造 P(特征向量为列)和 D(特征值为对角元),验证 A = PDP⁻¹。
03

工程应用

振动分析(固有频率)

机械系统和建筑结构的振动由特征值问题主导。质量-弹簧系统的运动方程经离散化后形式为 Mv'' + Kv = 0,其中 M 是质量矩阵,K 是刚度矩阵。设 v = e^(iωt)u,则得到广义特征值问题 Ku = ω²Mu。特征值 ω² 的平方根即为系统的固有频率,特征向量 u 描述对应的振型(mode shape)。避免共振的关键就是使外部激励频率远离结构的固有频率。

主成分分析(PCA前置)

PCA 的核心是对数据协方差矩阵 C 进行特征值分解。协方差矩阵是对称半正定的,其特征向量是数据方差最大的方向(主成分),特征值表示该方向上的方差大小。将数据投影到前 k 个最大特征值对应的特征向量上,即实现降维与去噪。

PageRank 算法

Google 的 PageRank 算法将网页链接结构建模为马尔可夫链的转移矩阵 P。寻找网页的重要性排名等价于求 P 的稳态分布,即对应于特征值 1 的左特征向量。PageRank 的收敛速度由第二大特征值的模决定,这解释了为什么某些链接结构需要更多次迭代才能稳定。

动力系统稳定性

线性动力系统 dx/dt = Ax 的稳定性完全由 A 的特征值决定:若所有特征值实部均小于 0,则系统渐近稳定;若任一特征值实部大于 0,则不稳定。离散系统 x_{k+1} = Ax_k 的稳定性要求所有特征值的模均小于 1。这一判据广泛应用于机器人控制、生态种群模型和经济预测。

量子力学可观测量

在量子力学中,物理可观测量对应厄米算符(复数域上的对称矩阵),其特征值即为该物理量可能的测量结果,特征向量对应量子态。薛定谔方程 iℏ∂ψ/∂t = Hψ 的形式解 ψ(t) = e^(-iHt/ℏ)ψ(0) 正是通过哈密顿量 H 的特征值分解得到的。

04

例题

例题 8.1

求矩阵 A 的特征值和特征向量:

A = [ 4 2 ]
     [ 1 3 ]

特征方程 det(A - λI) = 0:

| 4-λ 2 | = (4-λ)(3-λ) - 2 = λ² - 7λ + 10 = 0
| 1 3-λ |

解得:(λ - 5)(λ - 2) = 0,故 λ₁ = 5, λ₂ = 2。

对 λ₁ = 5,解 (A - 5I)v = 0:

[ -1 2 ][x] = [0]
[ 1 -2 ][y] [0]

得 x = 2y,取 v₁ = (2, 1)ᵀ。

对 λ₂ = 2,解 (A - 2I)v = 0:

[ 2 2 ][x] = [0]
[ 1 1 ][y] [0]

得 x = -y,取 v₂ = (1, -1)ᵀ(或 (-1, 1)ᵀ)。

λ₁=5, v₁=(2,1)ᵀ;   λ₂=2, v₂=(1,-1)ᵀ
例题 8.2

判断矩阵 A 是否可对角化,若可对角化,求 P 和 D 使得 A = PDP⁻¹:

A = [ 4 2 ]
     [ 1 3 ]

由例题 8.1,A 有两个不同的特征值 5 和 2,故必可对角化。

取 P = [v₁ v₂] = [ 2 1 ], D = [ 5 0 ]。

                        [ 1 -1 ]      [ 0 2 ]

验证 det(P) = -3 ≠ 0,P 可逆。

计算 P⁻¹ = (1/-3)[ -1 -1 ] = [ 1/3 1/3 ]

                     [ -1 2 ]   [ 1/3 -2/3 ]

验证 PDP⁻¹:

PD = [ 2 1 ][ 5 0 ] = [ 10 2 ]

     [ 1 -1 ][ 0 2 ]   [ 5 -2 ]

PDP⁻¹ = [ 10 2 ][ 1/3 1/3 ] = [ 4 2 ] = A

          [ 5 -2 ][ 1/3 -2/3 ]   [ 1 3 ]

P = [2 1; 1 -1], D = [5 0; 0 2], 验证成立。
例题 8.3

计算 A¹⁰⁰,其中 A = [4 2; 1 3]。

由对角化 A = PDP⁻¹,有 A¹⁰⁰ = PD¹⁰⁰P⁻¹。

D¹⁰⁰ = [ 5¹⁰⁰ 0 ]

         [ 0 2¹⁰⁰ ]

A¹⁰⁰ = [ 2 1 ][ 5¹⁰⁰ 0 ][ 1/3 1/3 ]

       [ 1 -1 ][ 0 2¹⁰⁰ ][ 1/3 -2/3 ]

先计算 PD¹⁰⁰ = [ 2·5¹⁰⁰ 2¹⁰⁰ ]

                 [ 5¹⁰⁰ -2¹⁰⁰ ]

再与 P⁻¹ 相乘:

A¹⁰⁰₁₁ = (2·5¹⁰⁰ + 2¹⁰⁰)/3,   A¹⁰⁰₁₂ = (2·5¹⁰⁰ - 2·2¹⁰⁰)/3

A¹⁰⁰₂₁ = (5¹⁰⁰ - 2¹⁰⁰)/3,    A¹⁰⁰₂₂ = (5¹⁰⁰ + 2·2¹⁰⁰)/3

A¹⁰⁰ = (1/3)[ 2·5¹⁰⁰+2¹⁰⁰   2·5¹⁰⁰-2¹⁰⁰⁺¹;   5¹⁰⁰-2¹⁰⁰   5¹⁰⁰+2¹⁰⁰⁺¹ ]
例题 8.4

判断下列矩阵是否可对角化:

A = [ 2 1 0 ]
     [ 0 2 0 ]
     [ 0 0 3 ]

A 是上三角矩阵,特征值即对角元:λ₁ = 2(代数重数 2),λ₂ = 3(代数重数 1)。

对 λ₁ = 2,求 Nul(A - 2I):

A - 2I = [ 0 1 0 ]
           [ 0 0 0 ]
           [ 0 0 1 ]

RREF 为 [ 0 1 0; 0 0 1; 0 0 0 ],主元列 2,3,自由变量 x₁。

零空间维数 = 1,即 λ=2 的几何重数为 1。

由于几何重数(1) < 代数重数(2),A 不可对角化。

A 不可对角化(特征值 2 的几何重数为 1,小于代数重数 2)。
05

MATLAB 实践

特征值与特征向量

MATLAB
% 定义矩阵 A = [4 2; 1 3]; % 计算特征值和特征向量 [V, D] = eig(A); % V 的列为特征向量,D 的对角元为特征值 disp('特征向量矩阵 V:'); disp(V); disp('特征值对角阵 D:'); disp(D); % 验证 AV = VD disp('AV:'); disp(A*V); disp('VD:'); disp(V*D);

对角化与矩阵幂

MATLAB
% 对角化验证 P = V; D = diag(diag(D)); A_reconstructed = P * D * inv(P); disp('PDP^{-1}:'); disp(A_reconstructed); % 计算 A^100 k = 100; A_power = P * (D.^k) * inv(P); disp(['A^{', num2str(k), '} =']); disp(A_power); % 与直接计算对比 disp('直接计算 A^100:'); disp(A^100);

特征值可视化

MATLAB
% 在复平面上绘制特征值 eigvals = eig(A); figure; plot(real(eigvals), imag(eigvals), 'bo', 'MarkerSize', 12, 'LineWidth', 2); hold on; plot(0, 0, 'k+', 'LineWidth', 1.5); grid on; axis equal; xlabel('实部'); ylabel('虚部'); title('特征值在复平面上的分布'); % 添加特征值标签 for i = 1:length(eigvals) text(real(eigvals(i))+0.1, imag(eigvals(i)), ... num2str(eigvals(i), '%.2f')); end

结果展示

MATLAB 命令行输出如下:

MATLAB 输出
特征向量矩阵 V: 0.8944 -0.7071 0.4472 0.7071 特征值对角阵 D: 5.0000 0 0 2.0000 AV: 4.4721 -1.4142 2.2361 1.4142 VD: 4.4721 -1.4142 2.2361 1.4142 PDP^{-1}: 4.0000 2.0000 1.0000 3.0000 A^{100} = 1.0e+69 * 1.6532 0.8266 0.4133 1.2399
特征值分布与矩阵幂的收敛行为
← 上一章:行列式 下一章:内积与正交性 →