叶卢庆的博客

在不同基下看同一个线性变换

设 $V$ 是一个 $n$ 维线性空间.我们知道,如果不设定有序基,那么想描述 $V$中的向量坐标是困难的,就像没有参照物,想描述物体的位置是困难的一样.因此如果没有有序基,想要描述线性映射 $T$ 也是困难的,就像没有参照物,想要描述物体的运动是困难的.可见有序基的重要.在不同的有序基下,看到的同一个向量的坐标是不同的,看到的同一个线性变换所对应的矩阵也是不同的.然而在不同有序基下,同一个线性变换所对应的矩阵之间是存在关系的,这就是这篇文章需要探讨的.

设 $\alpha=(v_1,\cdots,v_n)$ 和$\beta=(w_1,\cdots,w_n)$ 是 $V$ 的两组不同的有序基.且两组基之间的过渡矩阵为 $[I]_{\alpha}^{\beta}$,其中 $I$ 是 $V$ 到自身的恒等线性映射.
$$
[I]_{\alpha}^{\beta}=
\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}.
$$
易得 $[I]_{\alpha}^{\beta}$ 是可逆矩阵,其逆矩阵为
$$
[I]_{\beta}^{\alpha}=
\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}^{-1}.
$$
设$T$ 是从 $V$ 到 $V$ 的线性变换,且$$[T]_{\alpha}^{\alpha}=
\begin{pmatrix}
b_{11}&\cdots&b_{1n}\\
\vdots&\cdots&\vdots\\
b_{n1}&\cdots&b_{nn}
\end{pmatrix},[T]_{\beta}^{\beta}=\begin{pmatrix}
c_{11}&\cdots&c_{1n}\\
\vdots&\cdots&\vdots\\
c_{n1}&\cdots&c_{nn}
\end{pmatrix}.
$$
设 $V$ 中的某个向量 $k$ 在有序基 $\alpha$ 下的坐标为$(k_1,\cdots,k_n)$,也就是说,
$$
k=k_1v_1+\cdots+k_nv_n.
$$
则 $T(k)$ 在有序基 $\alpha$ 下的坐标为
$$
\begin{pmatrix}
b_{11}&\cdots&b_{1n}\\
\vdots&\cdots&\vdots\\
b_{n1}&\cdots&b_{nn}
\end{pmatrix}
\begin{pmatrix}
k_1\\
\vdots\\
k_n
\end{pmatrix}.
$$
而 $k$ 在有序基 $\beta$ 下的坐标会成为
$$
\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}
\begin{pmatrix}
k_1\\
\vdots\\
k_n
\end{pmatrix}.
$$
$T(k)$ 在有序基 $\beta$ 下的坐标会成为
$$
\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}
\begin{pmatrix}
b_{11}&\cdots&b_{1n}\\
\vdots&\cdots&\vdots\\
b_{n1}&\cdots&b_{nn}
\end{pmatrix}
\begin{pmatrix}
k_1\\
\vdots\\
k_n
\end{pmatrix}.
$$
可见,
$$
\begin{pmatrix}
c_{11}&\cdots&c_{1n}\\
\vdots&\cdots&\vdots\\
c_{n1}&\cdots&c_{nn}
\end{pmatrix}\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}=\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}
\begin{pmatrix}
b_{11}&\cdots&b_{1n}\\
\vdots&\cdots&\vdots\\
b_{n1}&\cdots&b_{nn}
\end{pmatrix},
$$

$$
\begin{pmatrix}
c_{11}&\cdots&c_{1n}\\
\vdots&\cdots&\vdots\\
c_{n1}&\cdots&c_{nn}
\end{pmatrix}=\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}
\begin{pmatrix}
b_{11}&\cdots&b_{1n}\\
\vdots&\cdots&\vdots\\
b_{n1}&\cdots&b_{nn}
\end{pmatrix}\begin{pmatrix}
a_{11}&\cdots&a_{1n}\\
\vdots&\cdots&\vdots\\
a_{n1}&\cdots&a_{nn}
\end{pmatrix}^{-1},
$$
也就是
$$
[T]_{\beta}^{\beta}=[I]_{\alpha}^{\beta}[T]_{\alpha}^{\alpha}[I]_{\beta}^{\alpha}.
$$
这就是在不同的基下看到的同一个线性变换所对应的矩阵$[T]_{\alpha}^{\alpha},[T]_{\beta}^{\beta}$的关系.

图1

事实上,在有序基 $\alpha$ 下,从 $V$ 到 $V$ 的一切可逆线性变换对应的矩阵形成了集合
$$
G_{\alpha}=\left\{[T]_{\alpha}^{\alpha}|T\mbox{是}V\mbox{到自身的可逆线性变换}\right\}.
$$
$G_{\alpha}$ 关于线性映射的复合形成了一个群.$G_{\alpha}$ 的单位元是恒等变换,每个变换的逆元都是该线性变换的逆变换.群 $G_{\alpha}$ 和$G_{\beta}$ 之间存在同构映射 $f:G_{\alpha}\to G_{\beta}$.对于 $G_{\alpha}$ 中的任意一个矩阵$[A]_{\alpha}^{\alpha}$,都有$G_{\beta}$ 中的矩阵$f(A)=[I]_{\alpha}^{\beta}[A]_{\alpha}^{\alpha}[I]_{\beta}^{\alpha}=[A]_{\beta}^{\beta}$与之对应.通过这个同构映射,能把有序基 $\alpha$ 下比较复杂的矩阵转化为有序基 $\beta$ 下比较简单的矩阵,从而转移问题难度.

比如,我们知道,对角矩阵具有特别良好的性质.如果有序基$\alpha$ 下的矩阵$[A]_{\alpha}^{\alpha}$通过同构映射 $f$映射成为有序基 $\beta$ 下的矩阵 $[A]_{\beta}^{\beta}$后,$[A]_{\beta}^{\beta}$ 是一个对角矩阵,那么称 $[A]_{\alpha}^{\alpha}$是可对角化矩阵.我们知道,$[A]_{\alpha}^{\alpha}$ 和$[A]_{\beta}^{\beta}$ 只是同一个线性变换$T$在不同的有序基下的表现形式,此时,我们称线性变换 $T$ 为可对角化线性变换.也就是说,一个线性变换是可对角化线性变换,当且仅当选择一个特殊的有序基后,该线性变换在那个有序基下的矩阵能成为对角矩阵.