第 11 章

线性变换的矩阵表示

同一个变换的不同面孔:基变换、相似矩阵与若尔当标准形

01

核心概念

基变换矩阵

设 B = {b₁, b₂, ..., bₙ} 和 C = {c₁, c₂, ..., cₙ} 是向量空间 V 的两组基。从 B 到 C 的基变换矩阵 PC←B 将 B-坐标转换为 C-坐标:

[x]C = PC←B [x]B

其中 PC←B 的第 j 列是 bⱼ 在 C-基下的坐标。特别地,若 C 是标准基,则 P 就是以 B 的向量为列的矩阵。

几何直觉

基变换只是"换一副眼镜"看同一个向量。向量本身不变,但其坐标表示随基的不同而改变。基变换矩阵就是这种"翻译"的工具。

相似矩阵

设 T: V → V 是线性变换。若 A 是 T 在基 B 下的矩阵,B 是 T 在基 C 下的矩阵,则:

B = P⁻¹AP

其中 P = PC←B。称 A 与 B 相似。相似矩阵代表同一个线性变换在不同基下的表示。

相似不变量

以下量在同相似类中保持不变,称为相似不变量

但特征向量会改变:若 Av = λv,则 B(P⁻¹v) = λ(P⁻¹v)。

若尔当标准形(思想)

并非所有矩阵都可对角化。当几何重数 < 代数重数时,特征向量不足。若尔当标准形是复数域上最简的相似代表:

A = PJP⁻¹,J = diag(J₁, J₂, ..., Jₖ)

每个若尔当块 Jᵢ 对应一个特征值 λ:

Jᵢ = [[λ,1,0,...],[0,λ,1,...],[...],[0,...,0,λ]]

若尔当形揭示了变换的"广义特征方向"——即使无法完全对角化,也能分解为伸缩与剪切作用的叠加。

关键要点

相似的本质是"同构视角"。A 和 B=P⁻¹AP 描述同一个变换,只是观察的坐标系不同。寻找最简单的相似代表(对角形或若尔当形)是理解变换结构的终极手段。

02

计算方法

1. 求变换在不同基下的矩阵

设 T 在标准基下的矩阵为 A,求 T 在基 B={b₁,...,bₙ} 下的矩阵 B:

2. 判断相似

两矩阵相似当且仅当它们有相同的:

对 2×2 矩阵,只需比较特征多项式和是否都可对角化。

3. 计算若尔当形(简单情况)

若 A 有唯一特征值 λ(代数重数 n),且 nullity(A−λI) = 1,则若尔当块只有一个 n×n 块。

若 nullity(A−λI) = k,则有 k 个若尔当块,块的大小由 (A−λI)ʲ 的秩决定。

03

工程应用

状态空间变换(控制理论)

线性系统的状态方程 ẋ = Ax + Bu 可通过相似变换 x = Pz 化为 ẋ = (P⁻¹AP)z + (P⁻¹B)u。选择合适的 P 可将系统化为可控标准形、可观标准形或对角形,极大简化控制器设计。

模态分析与坐标解耦

在结构动力学中,物理坐标下的耦合微分方程 Mẍ + Kx = 0 可通过模态矩阵(特征向量矩阵)P 变换到模态坐标:ÿ + Λy = 0。对角矩阵 Λ 使方程完全解耦,每个模态独立振动。

微分方程组解耦

线性常微分方程组 ẋ = Ax 的解可通过 x(t) = e^(At)x₀ 表示。若 A = PΛP⁻¹,则 e^(At) = Pe^(Λt)P⁻¹,指数矩阵的计算被大大简化。若 A 不可对角化,若尔当形仍提供计算 e^(At) 的系统方法。

量子力学表象变换

在量子力学中,物理量由厄米算符表示(复数域上的对称矩阵)。不同"表象"对应不同基,基变换就是相似变换(实际是幺正变换)。薛定谔绘景与海森堡绘景的转换本质上是基变换。

04

例题

例题 1:求变换矩阵

题目:设 T: R² → R² 在标准基下的矩阵为 A = [[2,1],[1,2]]。求 T 在基 B = {b₁=(1,1), b₂=(1,−1)} 下的矩阵 B。

解:

基变换矩阵 P = [b₁ b₂] = [[1,1],[1,−1]]。

det(P) = −1 − 1 = −2,故 P⁻¹ = (−1/2)[[−1,−1],[−1,1]] = [[0.5,0.5],[0.5,−0.5]]。

B = P⁻¹AP = [[0.5,0.5],[0.5,−0.5]] × [[2,1],[1,2]] × [[1,1],[1,−1]]

先算 AP = [[2,1],[1,2]] × [[1,1],[1,−1]] = [[3,1],[3,−1]]。

B = [[0.5,0.5],[0.5,−0.5]] × [[3,1],[3,−1]] = [[3,0],[0,1]]。

B = [[3,0],[0,1]](对角形,因为 B 恰好由特征向量组成)
例题 2:判断相似

题目:判断 A = [[3,1],[0,3]] 与 B = [[3,0],[0,3]] 是否相似。

解:

两矩阵特征值均为 λ=3(代数重数 2)。

对 A:A−3I = [[0,1],[0,0]],秩为 1,几何重数 = 2−1 = 1

对 B:B−3I = [[0,0],[0,0]],秩为 0,几何重数 = 2−0 = 2

几何重数不同,若尔当形不同:A 有一个 2×2 若尔当块,B 有两个 1×1 块。

A 与 B 不相似
例题 3:若尔当标准形

题目:求 A = [[4,1,−1],[0,3,1],[0,1,3]] 的若尔当标准形。

解:

Step 1 特征值:det(A−λI) = (4−λ)[(3−λ)²−1] = (4−λ)(λ²−6λ+8) = (4−λ)(λ−2)(λ−4) = (λ−4)²(λ−2)。

λ₁=4(代数重数 2),λ₂=2(代数重数 1)。

Step 2 λ=4 的几何重数:A−4I = [[0,1,−1],[0,−1,1],[0,1,−1]]。

行简化得 [[0,1,−1],[0,0,0],[0,0,0]],秩为 1,几何重数 = 3−1 = 2

几何重数 = 代数重数 = 2,故 λ=4 可对角化,有两个 1×1 若尔当块。

Step 3 λ=2:几何重数显然为 1。

若尔当形 J = [[4,0,0],[0,4,0],[0,0,2]]。

J = diag(4, 4, 2)(A 实际上可对角化)
例题 4:不可对角化矩阵的若尔当形

题目:求 A = [[5,1],[−1,3]] 的若尔当标准形及变换矩阵 P。

解:

特征多项式:det(A−λI) = (5−λ)(3−λ) + 1 = λ² − 8λ + 16 = (λ−4)²。

唯一特征值 λ=4,代数重数 2。

A−4I = [[1,1],[−1,−1]],秩为 1,几何重数 = 2−1 = 1 < 2。

故 A 不可对角化,若尔当形为一个 2×2 块:J = [[4,1],[0,4]]。

求广义特征向量:取 v₁ 满足 (A−4I)v₁=0,如 v₁=(1,−1)。

求 v₂ 满足 (A−4I)v₂ = v₁:[[1,1],[−1,−1]][x;y] = [1;−1] → x+y=1。取 v₂=(1,0)。

P = [v₁ v₂] = [[1,1],[−1,0]],验证 P⁻¹AP = J。

J = [[4,1],[0,4]],P = [[1,1],[−1,0]]
05

MATLAB 代码

MATLAB · 相似变换
% 标准基下的矩阵 A = [2 1; 1 2]; % 新基 P = [1 1; 1 -1]; % 新基下的矩阵 B = inv(P) * A * P % [3 0; 0 1] % 验证不变量 det(A), det(B) % 相等 trace(A), trace(B) % 相等 eig(A), eig(B) % 相同
MATLAB · 若尔当标准形(符号计算)
% 需要 Symbolic Math Toolbox syms lambda A = [5 1; -1 3]; % 若尔当形 [P, J] = jordan(A) J % [4 1; 0 4] % 验证 simplify(inv(P)*A*P) % 应等于 J % 特征值与几何重数 e = eig(A); % [4; 4] rank(A - 4*eye(2)) % 1,几何重数=1
MATLAB · 不同基下的矩阵表示
% 定义多项式空间 P2 上的微分变换 % 基 B = {1, t, t^2},标准基 E = {1, t, t^2} % D(p) = dp/dt % D 在标准基下的矩阵 D = [0 1 0; 0 0 2; 0 0 0]; % 新基 C = {1, 1+t, 1+t+t^2} P = [1 1 1; 0 1 1; 0 0 1]; % D 在新基下的矩阵 D_C = inv(P) * D * P
相似变换:同一变换在不同基下的矩阵
← 上一章:正交对角化与谱定理 下一章:奇异值分解 (SVD) →