第 10 章

正交对角化与谱定理

对称矩阵的完美结构:实特征值、正交特征向量与谱分解

01

核心概念

对称矩阵的性质

若矩阵 A 满足 A = Aᵀ,则称 A 为对称矩阵。对称矩阵拥有线性代数中最优美的性质:

为什么对称矩阵如此特殊?

对称性 A = Aᵀ 意味着变换在某种意义上是"自伴"的:u · (Av) = (Au) · v。这种内积下的对称性强制特征值为实数,并迫使不同特征空间互相正交。

谱定理(Spectral Theorem)

对称矩阵的谱定理是线性代数的核心结果之一:

A = QΛQᵀ = λ₁q₁q₁ᵀ + λ₂q₂q₂ᵀ + ... + λₙqₙqₙᵀ

其中 Q 是正交矩阵(列向量为标准正交特征向量),Λ 是对角矩阵(对角线为特征值)。

右侧的展开称为谱分解:对称矩阵可分解为秩1投影矩阵的加权和,权重为特征值。每一项 λᵢqᵢqᵢᵀ 将任意向量投影到 qᵢ 方向上再缩放 λᵢ 倍。

二次型

二次型是定义在 Rⁿ 上的齐次二次函数:

Q(x) = xᵀAx = Σᵢ Σⱼ aᵢⱼxᵢxⱼ

其中 A 是对称矩阵。通过正交变换 x = Py(P 为正交矩阵),可将二次型标准化

xᵀAx = yᵀΛy = λ₁y₁² + λ₂y₂² + ... + λₙyₙ²

这相当于将坐标轴旋转到与特征向量对齐,消去交叉项。

正定性的判定

对称矩阵 A 的正定性可通过特征值或主子式判断:

正定矩阵对应二次型 Q(x) > 0(x ≠ 0),几何上表示一个开口向上的椭抛物面。

关键要点

谱定理表明:对称矩阵在正交变换下可完全对角化,这是少数"总是可对角化"的矩阵族之一。正定性判定的两种方法(特征值 vs 主子式)各有优势:特征值揭示几何本质,主子式便于手算判定。

02

计算方法

1. 对称矩阵对角化

步骤:求特征值 → 求特征向量 → 正交化(同特征值内部)→ 单位化 → 组装 Q 和 Λ。

由于不同特征值的特征向量已自动正交,只需对重特征值的特征向量做 Gram-Schmidt 正交化。

2. 二次型标准化

以 Q(x) = 3x₁² + 2x₁x₂ + 3x₂² 为例:

3. 判断正定性

对 3×3 矩阵 A,计算顺序主子式:

若 D₁>0, D₂>0, D₃>0,则 A 正定;若符号交替(−,+,−),则负定。

03

工程应用

振动模态分析

在结构工程中,质量矩阵 M 和刚度矩阵 K 通常对称。求解广义特征值问题 Kφ = ω²Mφ 得到固有频率 ω 和模态形状 φ。对称性保证模态互相正交,可将复杂振动分解为独立模态的叠加。

协方差矩阵的谱分解

在统计学中,数据协方差矩阵 Σ 对称半正定。谱分解 Σ = QΛQᵀ 给出主成分方向(特征向量)和方差解释量(特征值)。这是主成分分析(PCA)的数学基础。

优化问题与 Hessian 矩阵

多元函数 f(x) 在临界点处的 Hessian 矩阵 H(二阶偏导数矩阵)对称。若 H 正定,则该点为局部极小值;若负定,则为局部极大值。优化算法(如牛顿法)利用 Hessian 的谱分解确定搜索方向。

物理惯性张量

刚体的惯性张量 I 是 3×3 对称矩阵,描述质量相对于旋转轴的分布。其特征值为主转动惯量,特征向量为主轴方向。谱分解将任意旋转分解为绕三个主轴的独立转动。

04

例题

例题 1:对称矩阵对角化

题目:将 A = [[4,2],[2,4]] 正交对角化,求正交矩阵 Q 和对角矩阵 Λ 使得 A = QΛQᵀ。

解:

Step 1 求特征值:det(A−λI) = (4−λ)² − 4 = λ² − 8λ + 12 = (λ−6)(λ−2) = 0。

得 λ₁ = 6,λ₂ = 2。

Step 2 求特征向量:

  • λ₁=6:A−6I = [[−2,2],[2,−2]] → v₁ = (1, 1)
  • λ₂=2:A−2I = [[2,2],[2,2]] → v₂ = (−1, 1)

验证:v₁ · v₂ = −1 + 1 = 0,已正交。

Step 3 单位化:e₁ = (1/√2, 1/√2),e₂ = (−1/√2, 1/√2)。

Step 4 组装:Q = [[1/√2, −1/√2],[1/√2, 1/√2]],Λ = [[6,0],[0,2]]。

Q = [[0.707, −0.707],[0.707, 0.707]], Λ = [[6,0],[0,2]]
例题 2:二次型标准化

题目:将二次型 Q(x) = 2x₁² + 4x₁x₂ + 5x₂² 化为标准形,并指出对应的曲面类型。

解:

对称矩阵 A = [[2,2],[2,5]]。

特征方程:det(A−λI) = (2−λ)(5−λ) − 4 = λ² − 7λ + 6 = (λ−6)(λ−1) = 0。

λ₁=6,λ₂=1,均为正数。

λ₁=6:[[−4,2],[2,−1]] → v₁=(1,2);λ₂=1:[[1,2],[2,4]] → v₂=(−2,1)。

单位化:e₁=(1/√5, 2/√5),e₂=(−2/√5, 1/√5)。

标准形:Q = 6y₁² + y₂²

由于两个特征值均为正,Q = 1 表示一个椭圆,Q(x) 是正定二次型。

标准形:6y₁² + y₂²;正定;Q=1 为椭圆
例题 3:判断正定性

题目:判断下列矩阵的正定性:

(a) A = [[2,−1,0],[−1,2,−1],[0,−1,2]] (b) B = [[1,2],[2,1]]

解 (a):

顺序主子式:D₁ = 2 > 0;D₂ = 4−1 = 3 > 0;D₃ = det(A) = 2(4−1) + 1(−2−0) = 6−2 = 4 > 0。

所有顺序主子式为正,A 正定

验证特征值:det(A−λI) = (2−λ)[(2−λ)²−1] + 1[−(2−λ)] = (2−λ)(λ²−4λ+2) = 0。

λ = 2, 2±√2,即 λ ≈ 3.414, 2, 0.586,全为正。

解 (b):

D₁ = 1 > 0;D₂ = 1−4 = −3 < 0。

顺序主子式符号为 +, −,B 不定(实际是负定阶1,正不定)。

特征值:det(B−λI) = (1−λ)² − 4 = λ² − 2λ − 3 = (λ−3)(λ+1) = 0。

λ₁=3>0, λ₂=−1<0,有正有负,确为不定矩阵

A 正定;B 不定
例题 4:谱分解应用

题目:对 A = [[5,2],[2,2]] 进行谱分解,并计算 A⁵。

解:

特征值:λ² − 7λ + 6 = (λ−6)(λ−1) = 0 → λ₁=6, λ₂=1。

特征向量:v₁=(2,1), v₂=(−1,2)。单位化:q₁=(2/√5,1/√5), q₂=(−1/√5,2/√5)。

谱分解:A = 6q₁q₁ᵀ + 1q₂q₂ᵀ。

利用谱分解计算幂:A⁵ = QΛ⁵Qᵀ = 6⁵q₁q₁ᵀ + 1⁵q₂q₂ᵀ = 7776 q₁q₁ᵀ + q₂q₂ᵀ。

q₁q₁ᵀ = (1/5)[[4,2],[2,1]],q₂q₂ᵀ = (1/5)[[1,−2],[−2,4]]。

A⁵ = (7776/5)[[4,2],[2,1]] + (1/5)[[1,−2],[−2,4]] = (1/5)[[31105, 15550],[15550, 7780]]。

A⁵ = [[6221, 3110],[3110, 1556]](近似整数结果)
05

MATLAB 代码

MATLAB · 对称矩阵特征分解
% 对称矩阵 A = [4 2; 2 4]; % 特征分解(对称矩阵默认返回正交 Q) [Q, Lambda] = eig(A); Q % 正交矩阵 Lambda % 对角特征值矩阵 % 验证正交性 Q'*Q % 应为单位矩阵 Q*Lambda*Q' % 重构 A % 特征值排序(从大到小) [lambda, idx] = sort(diag(Lambda), 'descend'); Q = Q(:, idx);
MATLAB · 二次型曲面绘制
% 二次型 3x² + 2xy + 3y² 的曲面 [X, Y] = meshgrid(linspace(-2,2,100)); Z = 3*X.^2 + 2*X.*Y + 3*Y.^2; figure; surf(X, Y, Z); shading interp; colormap jet; xlabel('x'); ylabel('y'); zlabel('Q(x,y)'); title('正定二次型:椭抛物面'); % 绘制等高线(椭圆) figure; contour(X, Y, Z, 20); axis equal; colorbar; title('二次型等高线');
MATLAB · 判断正定性
% 判断正定性函数 function s = definiteness(A) e = eig(A); if all(e > 0) s = '正定'; elseif all(e >= 0) s = '半正定'; elseif all(e < 0) s = '负定'; elseif all(e <= 0) s = '半负定'; else s = '不定'; end end % 测试 A = [2 -1 0; -1 2 -1; 0 -1 2]; definiteness(A) % 正定
特征值分布与正定性判定示意
← 上一章:内积与正交性 下一章:线性变换的矩阵表示 →