高等代数7 线性变换

2023-11-05 19:31:58

高等代数7 线性变换

高等代数7 线性变换
线性变换的定义
线性变换的运算
- 乘法
- 加法
- 数量乘法
- 逆变换
- 多项式
线性变换的矩阵
特征值与特征向量
对角矩阵

线性变换的定义

线性空间\(V\)到自身的映射通常称为\(V\)的一个变换。

定义

线性空间\(V\)的一个变换\(\mathscr{A}\)称为线性变换，如果对于\(V\)中任意的元素\(\alpha,\beta\)和数域\(P\)中的任意数\(k\)都有

\[\mathscr{A}(\alpha+\beta)=\mathscr{A}(\alpha)+\mathscr{A}(\beta) \\ \mathscr{A}(k\alpha)+k\mathscr{A}(\alpha) \]

线性变换\(\mathscr{A}\)保持向量的加法和数量乘法。
恒等变换、单位变换 \(\mathscr{E}(\alpha)=\alpha \ \ (\alpha \in V)\)
零变换\(\mathscr{0}\) \(\mathscr{0}(\alpha)=0 \ \ (\alpha \in V)\)
数乘变换 设\(V\)是数域\(P\)上的线性空间，\(k\)是数域\(P\)上的某个数，定义\(V\)的变换：\(\alpha \rightarrow k\alpha, \ \ \alpha\in V\)

这是一个线性变换，称为由数\(k\)决定的数乘变换。
简单性质
1. 线性空间\(V\)的一个线性变换\(\mathscr{A}\)，则\(\mathscr{A}(0)=0,\mathscr{A}(-a)=-\mathscr{A}(a)\)
2. 线性变换保持线性组合不变
  
  \[\beta=k_1\alpha_1+k_2\alpha_2+\cdots+k_r\alpha_r \\ \mathscr{A}(\beta)=k_1\mathscr{A}(\alpha_1)+k_2\mathscr{A}(\alpha_2)+\cdots+k_r\mathscr{A}(\alpha_r) \\ \]
3. 线性变换把线性相关的向量组变成线性相关的向量组。

线性变换的运算

线性变换作为映射的特殊情形可以定义乘法运算

乘法

设\(\mathscr{A},\mathscr{B}\)是线性空间\(V\)上的两个线性变换，它们的乘积\(\mathscr{A}\mathscr{B}\)为\((\mathscr{A}\mathscr{B})(\alpha)=\mathscr{A}(\mathscr{B}(\alpha)) \ \ \ (\alpha \in V)\)

线性变换的乘积也是线性变换。
- 适合结合律 \((\mathscr{A}\mathscr{B})\mathscr{C}=\mathscr{A}(\mathscr{B}\mathscr{C})\)
- 一般是不可交换的
- 单位变换\(\mathscr{E}\) \(\mathscr{E}\mathscr{A}=\mathscr{A}\mathscr{E}=\mathscr{A}\)

加法

设\(\mathscr{A},\mathscr{B}\)是线性空间\(V\)上的两个线性变换，它们的和\(\mathscr{A}+\mathscr{B}\)为\((\mathscr{A}+\mathscr{B})(\alpha)=\mathscr{A}(\alpha)+\mathscr{B}(\alpha) \ \ \ (\alpha \in V)\)

线性变换的和还是线性变换
- 交换律 \(\mathscr{A}+\mathscr{B}=\mathscr{B}+\mathscr{A}\)
- 结合律 \((\mathscr{A}+\mathscr{B})+\mathscr{C}=\mathscr{A}+(\mathscr{B}+\mathscr{C})\)
- 零变换\(\mathscr{0}\) \(\mathscr{A}+\mathscr{0}=\mathscr{A}\)
- 负变换 \(\mathscr{A}+(-\mathscr{A})=\mathscr{0}\) .负变换也是线性的。

线性变换乘法对加法具有左右分配律

\(\mathscr{A}(\mathscr{B}+\mathscr{C})=\mathscr{A}\mathscr{B}+\mathscr{A}\mathscr{C}\)

\((\mathscr{B}+\mathscr{C})\mathscr{A}=\mathscr{B}\mathscr{A}+\mathscr{C}\mathscr{A}\)

数量乘法

数域\(P\)中的数与线性变换的数量乘法为 \(k\mathscr{A}=\mathscr{K}\mathscr{A}\)
- \((kl)\mathscr{A}=k(l\mathscr{A})\)
- \((k+l)\mathscr{A}=k\mathscr{A}+l\mathscr{A}\)
- \(k(\mathscr{A}+\mathscr{B})=k\mathscr{A}+k\mathscr{B}\)
- \(1\mathscr{A}=\mathscr{A}\)

线性空间\(V\)上全体线性变换，对于如上定义的加法与数量乘法，也构成数域\(P\)上的一个线性空间

逆变换

\(V\)上的变换\(\mathscr{A}\)称为可逆的，如果有\(V\)的变换\(\mathscr{B}\)存在，使 \(\mathscr{A}\mathscr{B}=\mathscr{B}\mathscr{A}=\mathscr{E}\)

这时，变换\(\mathscr{A}\)称为\(\mathscr{A}\)的逆变换，称为\(\mathscr{A}^{-1}\)

如果线性变换\(\mathscr{A}\)是可逆的，那么它的逆变换\(\mathscr{A}^{-1}\)也是线性变换。

多项式

幂

\(\mathscr{A}^n=\mathscr{A}\mathscr{A}\cdots\mathscr{A}(n个)\)，\(\mathscr{A}^n\)称为\(\mathscr{A}\)的\(n\)次幂
- \(\mathscr{A}^0=\mathscr{A}\)
- 指数法则 \(\mathscr{A}^{n+m}=\mathscr{A}^n\mathscr{A}^m \\ (\mathscr{A}^m)^n=\mathscr{A}^mn\)
- 注意一般来说， \((\mathscr{A}\mathscr{B})^n \neq \mathscr{A}^n \mathscr{B}^n\)
多项式

设 \(f(x)=a_mx^m+a_{m-1}x^{m-1}+\cdots+a_0x^0\)是\(P[x]\)中的一个多项式， \(\mathscr{A}\)是\(V\)的一线性变换

\(f(\mathscr{A})=a_m\mathscr{A}^m+a_{m-1}\mathscr{A}^{m-1}+\cdots+a_0\mathscr{A}^0\)是一线性变换，它称为线性变换\(\mathscr{A}\)的多项式。
- 如果在\(P[x]\)中，\(h(x)=f(x)+g(x),p(x)=f(x)g(x)\)，那么\(h(\mathscr{A})=f(\mathscr{A})+g(\mathscr{A}),p(\mathscr{A})=f(\mathscr{A})g(\mathscr{A})\)
- 可交换 \(f(\mathscr{A})g(\mathscr{A})=g(\mathscr{A})f(\mathscr{A})\) 即同一个线性变换的多项式的乘法是可交换的。

线性变换的矩阵

线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵

设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基。

如果线性变换\(\mathscr{A}\)与\(\mathscr{B}\)在这组基上的作用相同，即\(\mathscr{A}\varepsilon_i=\mathscr{B}\varepsilon_i,\ \ i=1,2,\cdots,n\) 那么\(\mathscr{A}=\mathscr{B}\)。

意义：一个线性变换完全被它在一组基上的作用决定
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基。

对于任意一组向量\(\alpha_1,\alpha_2,\cdots,\alpha_n\)，一定有一个线性变换\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)

意义：基向量的像完全可以是任意的

定理

设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基，\(\alpha_1,\alpha_2,\cdots,\alpha_n\)是\(V\)中的任意\(n\)个向量。

存在唯一的线性变换\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)
定义

设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是数域\(P\)上\(n\)维线性空间\(V\)的一组基，\(\mathscr{A}\)是\(V\)的一个线性变换。

基向量的像可以被基线性表出：

\[\begin{cases} \mathscr{A}\varepsilon_1=a_{11}\varepsilon_1 +a_{12}\varepsilon_2+\cdots +a_{1n}\varepsilon_n \\ \mathscr{A}\varepsilon_2=a_{21}\varepsilon_1 +a_{22}\varepsilon_2+\cdots +a_{2n}\varepsilon_n \\ \ \ \ \cdots \cdots \\ \mathscr{A}\varepsilon_n=a_{n1}\varepsilon_1 +a_{n2}\varepsilon_2+\cdots +a_{nn}\varepsilon_n \\ \end{cases} \\ \mathscr{A}(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) =(\mathscr{A}\varepsilon_1,\mathscr{A}\varepsilon_2,\cdots,\mathscr{A}\varepsilon_n) =(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \\ A= \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \]

其中\(A\)称为线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵

在取定一组基后，我们就建立了由数域\(P\)上的\(n\)维线性空间\(V\)的线性变换到数域\(P\)上的\(n \times n\)矩阵的一个映射，1说明这个映射是单射，2说明是满射，因此这个映射是一一对应的（双射）。

定理

设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是数域\(P\)上\(n\)维线性空间\(V\)的一组基，在这组基下，每个线性变换按着公式(3)对应一个\(n \times n\)矩阵。这个对应具有以下性质：
1. 线性变换的和对应矩阵的和；
2. 线性变换的乘积对应矩阵的乘积；
3. 线性变换的数量乘积对应矩阵的数量乘积；
4. 可逆的线性变换与可逆矩阵对应，且逆变换对应逆矩阵。
定理说明，数域\(P\)上\(n\)维线性空间\(V\)的全部线性变换构成的集合\(L(V)\)对于线性变换的加法与数量乘法构成\(P\)上一个线性空间，与数域\(P\)上\(n\)级方阵构成的线性空间\(P^{n \times n}\)同构。

线性变换的矩阵计算向量的像

定理

设线性变换\(\mathscr{A}\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的矩阵是\(A\)，向量\(\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标是\((x_1,x_2,\cdots,x_n)\)，

则\(\mathscr{A}\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标\((y_1，y_2,\cdots,y_n)\)可以按公式

\[\left ( \begin{matrix} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \\ \end{matrix} \right ) =A \left ( \begin{matrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \\ \end{matrix} \right ) \]

计算。

线性变换的矩阵与基的关系

定理

线性空间\(V\)的线性变换\(\mathscr{A}\)在两组基

\[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n \\ \eta_1,\eta_2,\cdots,\eta_n \]

下的矩阵分别是\(A,B\)，从基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)到基\(\eta_1,\eta_2,\cdots,\eta_n\)的过渡矩阵是\(X\)，于是\(B=X^{-1}AX\).

这个定理告诉我们，同一个线性变换\(\mathscr{A}\)在不同基下的矩阵之间的关系。

相似

定义相似

设\(A、B\)是数域\(P\)上两个\(n\)级矩阵，如果可以找到数域\(P\)上的\(n\)级可逆矩阵\(X\)，使得\(B=X^{-1}AX\)，就说\(A\)相似于\(B\)，记作\(A \sim B\)
性质
1. 自反性 \(A\sim A\)
2. 对称性 \(A \sim B ,B \sim A\)
3. 传递性 \(A \sim B ,B \sim C\)，则\(A \sim C\)
定理

线性变换在不同基下所对应的矩阵是相似的。

如果两个矩阵相似，那么它们可以看作同一个线性变换在两组基下所对应的矩阵。
运算性质

如果\(B_1=X^{-1}A_1X,B_2=X^{-1}A_2X\)，那么
1. \(B_1+B_2=X^{-1}(A_1+A_2)X\)
2. \(B_1B_2=X^{-1}(A_1A_2)X\)
3. 若\(f(x)\)是数域\(P\)上一多项式 \(f(B)=X^{-1}f(A)X\)

特征值与特征向量

定义

适当选择一组基后，一个线性变换的矩阵可以化成什么样的简单形式

定义特征值、特征向量

设\(\mathscr{A}\)数域\(P\)上\(n\)维线性空间\(V\)的一个线性变换，如果对于数域\(P\)中一数\(\lambda_0\)，存在一个非零向量\(\xi\)，使得

\[\mathscr{A}\xi= \lambda_0\xi \]

那么\(\lambda_0\)称为\(\mathscr{A}\)的一个特征值，而\(\xi\)称为\(\mathscr{A}\)的属于特征值\(\lambda_0\)的一个特征向量。

特征值是被特征向量唯一决定的，一个特征向量只能属于一个特征值。

寻找特征值和特征向量的方法

定义特征多项式

设\(A\)是数域\(P\)上一\(n\)级矩阵，\(\lambda\)是一个文字。

矩阵\(\lambda E-A\)的行列式

\[|\lambda E-A| =\left | \begin{matrix} \lambda-a_{11} &- a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ - a_{s1} & -a_{s2} & \cdots & \lambda-a_{sn} \\ \end{matrix} \right | \]

称为\(A\)的特征多项式。

这是数域\(P\)上的一个\(n\)次多项式。

求特征值\(\lambda_0\)与特征向量\(\xi\)

取一组基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\),写\(\mathscr{A}\)在这组基下的矩阵\(A\);
求出特征多项式\(|\lambda E-A|\)的根\(\lambda=(\lambda_1,\lambda_2,\cdots,\lambda_n)\)，（\(\lambda\)是线性变换\(\mathscr{A}\)的全部特征值）；
将特征值带入方程组

\[(\lambda_i E-A)\left ( \begin{matrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \\ \end{matrix} \right )=0 \\ \begin{cases} (\lambda_0 -a_{11})x_1 +a_{12}x_2+\cdots +a_{1n}x_n=0 \\ a_{21}x_1 +(\lambda_0-a_{22})x_2+\cdots +a_{2n}x_n=0 \\ \ \ \ \cdots \cdots \\ a_{n1}x_1 +a_{n2}x_2+\cdots +(\lambda_0-a_{nn})x_n=0 \\ \end{cases} \]

解得基础解系\((x_1,x_2,\cdots,x_n)_i\)。（也就是特征向量\(\xi_i\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标）

\(\xi_i=x_1\varepsilon_1+x_2\varepsilon_2+\cdots+x_n\varepsilon_n\)

特征子空间

定义

线性变换\(\mathscr{A}\)的任一个特征值\(\lambda_0\)，全部适合条件 \(\mathscr{A}\alpha=\lambda_0 \alpha\)的向量\(\alpha\)所组成的集合，也就是\(\mathscr{A}\)的属于\(\lambda_0\)的全部特征向量再添上零向量组成的集合，是\(V\)的一个子空间，称为\(\mathscr{A}\)的一个特征子空间，记作\(V_{\lambda_0}\).

\(V_{\lambda_0}\)的维数就是属于\(\lambda_0\)的线性无关的特征向量的最大个数。

用集合表示可写为\(V_{\lambda_0}=\{\alpha|\mathscr{A}\alpha=\lambda_0 \alpha ,\alpha \in V\}\)

特征多项式

\[|\lambda E-A| =\left | \begin{matrix} \lambda-a_{11} &- a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ - a_{s1} & -a_{s2} & \cdots & \lambda-a_{sn} \\ \end{matrix} \right | \]

迹 \(A\)的全体特征值的和为\(a_{11}+a_{22}+\cdots+a_{nn}\)，称为\(A\)的迹，记为\(Tr(A)\)。
积 \(A\)的全体特征值的积为\(|A|\)。
定理相似的矩阵有相同的特征多项式。

线性变换的矩阵的特征多项式与基的选择无关，直接被线性变换决定，特征多项式可以称为线性变换的多项式
哈密顿—凯莱定理

设\(A\)是数域\(P\)上一个\(n \times n\)矩阵，\(f(\lambda)=|\lambda E-A|\)是\(A\)的特征多项式，则

\[f(A)=A^n-(a_{11}+a_{22}+\cdots+a_{nn})A^{n-1}+\cdots+(-1)^n|A|E =O \]

码农公寓

高等代数7 线性变换

线性变换的定义

线性变换的运算

乘法

加法

数量乘法

逆变换

多项式

线性变换的矩阵

线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵

线性变换的矩阵计算向量的像

线性变换的矩阵与基的关系

相似

特征值与特征向量

定义

寻找特征值和特征向量的方法

特征子空间

特征多项式

对角矩阵

相关文章