模论的笔记中,有关结构定理的形式化的表达可能能让我们产生一个关于线性映射的零化多项式的联想:对于每个子空间和线性映射在这个子空间的作用,取一个零化多项式,那么所有零化多项式的 LCM 就应该是线性映射的最小多项式. 将最小多项式的倍数形成的主理想商掉之后,就能划分出一个不能被更小的多项式零化的子空间,然后对剩下的子空间继续这么做... 接下来严谨地探讨这件事情.

\(F\) 模就是 \(F-\)向量空间. 下面有一个很神秘的想象,就是去把 \(F\) 模升级成 \(F[X]\)\(M\). 所谓升级,就是仅仅拓展纯量乘法的定义.

下面给出一个升级方式:先指定一个线性映射 \(T\). 对于 \(v\in M\),定义 \(X\cdot v=Tv\). 于是对于多项式 \(f(X)\)\(f(X)\cdot v\) 即将 \(f(T)\) 作用于 \(v\).

这种定义首先是符合模的要求的. 其次确实所有 \(Ann(v)\) 的交恰好对应了 \(T\) 的零化多项式.

首先看 \(T\)\(M\) 的对应关系. 在同构等价类下,\(n\) 维线性映射 \(T\)\(n\)\(F[X]-\)模形成了双射. 映射方式即前面所述. 单性显然,满性也显然(因为 \(F[X]\times V\to V\) 的映射要是线性的).

首先我们注意到 \(\deg \le n\) 的最小多项式的存在性,所以不会存在自由子模. 那么根据前面的结构定理,应该唯一存在一列 \(f_1\mid f_2\mid \dots \mid f_k\),使得 \(M=(F[X]/f_1)\oplus\dots\oplus (F[X]/f_k)\).

模的直和分解应该直接对应于 \(T\) 的分块对角. 那么我们看子模 \(F[X]/f_i\) 再对应回矩阵形式是什么样的,即找到 \(rank=\deg f_i\)\(T\) 使得 \(f_i(T)=0\). 显然取 \(f_i\) 的友矩阵 \(C_{f_i}\). 即是我们想要的答案.

于是我们就得到了矩阵的有理标准型

  • 对于任意矩阵 \(A\in M_{n\times n}(F)\),存在一列 \(f_1\mid \dots\mid f_k\),使得 \(\sum \deg f_i=n\),而矩阵同构于 \(\operatorname{diag}(C_{f_1},\dots,C_{f_k})\).
  • \(f_1,\dots,f_k\) 称为 \(A\) 的不变因子,而 \(Min_A=f_k\)\(Char_A=\prod f_i\).

如何求解有理标准型?本质就是求解不变因子. 那么实际上我们就是要求 \(F[X]\) 商掉的那些理想.

选定一组 \(M\) 的基 \(v_i\),以及 \(F[X]^{\oplus n}\) 的标准基 \(e_i\),我们探讨 \(F[X]^{\oplus n}\to M\) 的线性映射 \(\varphi\),根据上面的结论肯定是 \(\varphi(\sum g_ie_i)=\sum g_i(T) v_i\).

\(x_i=Xe_i-\sum_{j=1}^{n}a_{i,j}e_j\),则 \(\langle x_1,\dots,x_n\rangle\) 生成的子模 \(N\) 即为 \(\ker \varphi\). 验证是容易的:\(\varphi(x_i)=T v_i-\sum_{j=1}^{n} a_{i,j}v_i=0\). 通过这个核 \(N\),我们知道了 \(M\) 通过 \(\varphi\) 诱导的同态 \(\overline\varphi\),同构于 \(F[X]^{\oplus n}/N\).

下面关注子模 \(N\). 我们已经求得子模 \(N\) 的矩阵表法 \(\langle x_1,\dots,x_n\rangle=XI-T\),那么下面只需要套用 Smith 标准型的理论,即可知存在可逆 \(P,Q\) 使得 \(N=PDQ\),其中 \(D=diag(d_1,\dots,d_k)\)\(d_1|d_2|\dots |d_k\). 于是 \(F[X]^{\oplus n}/N\) 同构于 \(F[X]^{\oplus n}/D\) 同构于 \(\bigoplus_{i=1}^{n} F[X]/d_i\).

取所有 \(d_i\neq 1\)\(d\) 即得到所有的不变因子.

于是步骤就是:对 \(XI-T\) 求 Smith 标准型,然后提出所有 \(\neq 1\) 的项即得到不变因子,然后再得到友矩阵组成的分块对角矩阵.


下面关注 Jordan 标准型. Jordan 标准型的出发点是幂零矩阵. 幂零矩阵的特点在于特征多项式是 \(X^n\),且存在 \(k\) 使得最小多项式为 \(X^k\). 并且一个重要特征是 \(A\) 幂零等价于 \(V=V_{[0]}\).

定义 Jordan 块 \(J_d(\lambda)\) 为满足对角线上为 \(\lambda\),而次对角线为 \(1\) 的上三角矩阵. 同理可以定义下 Jordan 块为其专制. 容易发现下 \(J_d(0)\)\(X^d\) 的友矩阵,而下 Jordan 块显然相似于上 Jordan 块,所以幂零矩阵同构于若干个 \(J_{d_i}(\lambda)\) 的分块对角.

然后再看到普通的矩阵. 对于矩阵 \(A\),若其特征多项式分裂,则有广义特征子空间分解 \(V=\bigoplus_i V_{[\lambda _i]}\),于是考虑对于每个广义特征子空间,其减去 \(\lambda_i\) 后显然应该满足幂零. 而每个幂零矩阵可以写成若干个 Jordan 块的形式,所以 \(A\) 也可以写成 Jordan 块的分块对角.

注意到这是一个严格比矩阵的上三角化更加强的结论.

这可以引出 Jordan-Chevalley 分解. 对于特征多项式分裂的 \(A\),存在唯一一对 \(S,N\) 使得 \(S\) 可对角化,\(N\) 幂零,而 \(T=S+N\)\(SN=NS\). 存在性由 Jordan 标准型直接得到:同构于若干个 Jordan 块后,每个 Jordan 就可以直接拆分成对角矩阵和幂零矩阵. 唯一性考虑对于每个 \(S\) 的特征值 \(\lambda_i\) 和特征子空间 \(V_i\),由于 \(N-\lambda_i\) 幂零,所以 \(V_i\subset V_{[\lambda_i]}\). 而由于 \(V_i\) 的直和为整个空间,所以 \(V_i=V_{[\lambda_i]}\),故 \(\lambda_i\) 也为 \(T\) 的特征值,进而得到唯一性.

我们来看如何求解 Jordan 标准型. 这里直接给出结论——相关证明和幂零性直接相关并且可能不是很困难,但我不想证了. 以下论述对于幂零矩阵成立.

  • Jordan 块的总数为 \(n-rk(T)\).
  • \(d\times d\) 的 Jordan 块的数量为 \(rk(T^{d+1})-2rk(T^d)+rk(T^{d-1})\).

对于非幂零矩阵,求解特征多项式之后对于每个特征子空间求解然后分块对角即可.


参考讲义:李文威-代数学讲义