高等代数7 线性变换

高等代数7 线性变换


目录


线性变换的定义

线性空间\(V\)到自身的映射通常称为\(V\)的一个变换

  • 定义

    线性空间\(V\)的一个变换\(\mathscr{A}\)称为线性变换,如果对于\(V\)中任意的元素\(\alpha,\beta\)和数域\(P\)中的任意数\(k\)都有

    \[\mathscr{A}(\alpha+\beta)=\mathscr{A}(\alpha)+\mathscr{A}(\beta) \\ \mathscr{A}(k\alpha)+k\mathscr{A}(\alpha) \]

    线性变换\(\mathscr{A}\)保持向量的加法和数量乘法。

    高等代数7 线性变换

  • 恒等变换、单位变换 \(\mathscr{E}(\alpha)=\alpha \ \ (\alpha \in V)\)

  • 零变换\(\mathscr{0}\) \(\mathscr{0}(\alpha)=0 \ \ (\alpha \in V)\)

  • 数乘变换 设\(V\)是数域\(P\)上的线性空间,\(k\)是数域\(P\)上的某个数,定义\(V\)的变换:\(\alpha \rightarrow k\alpha, \ \ \alpha\in V\)

    这是一个线性变换,称为由数\(k\)决定的数乘变换

  • 简单性质

    1. 线性空间\(V\)的一个线性变换\(\mathscr{A}\),则\(\mathscr{A}(0)=0,\mathscr{A}(-a)=-\mathscr{A}(a)\)

    2. 线性变换保持线性组合不变

      \[\beta=k_1\alpha_1+k_2\alpha_2+\cdots+k_r\alpha_r \\ \mathscr{A}(\beta)=k_1\mathscr{A}(\alpha_1)+k_2\mathscr{A}(\alpha_2)+\cdots+k_r\mathscr{A}(\alpha_r) \\ \]

    3. 线性变换把线性相关的向量组变成线性相关的向量组。

线性变换的运算

线性变换作为映射的特殊情形可以定义乘法运算

乘法

  • 设\(\mathscr{A},\mathscr{B}\)是线性空间\(V\)上的两个线性变换,它们的乘积\(\mathscr{A}\mathscr{B}\)为\((\mathscr{A}\mathscr{B})(\alpha)=\mathscr{A}(\mathscr{B}(\alpha)) \ \ \ (\alpha \in V)\)

    线性变换的乘积也是线性变换。

    • 适合结合律 \((\mathscr{A}\mathscr{B})\mathscr{C}=\mathscr{A}(\mathscr{B}\mathscr{C})\)
    • 一般是不可交换的
    • 单位变换\(\mathscr{E}\) \(\mathscr{E}\mathscr{A}=\mathscr{A}\mathscr{E}=\mathscr{A}\)

加法

  • 设\(\mathscr{A},\mathscr{B}\)是线性空间\(V\)上的两个线性变换,它们的和\(\mathscr{A}+\mathscr{B}\)为\((\mathscr{A}+\mathscr{B})(\alpha)=\mathscr{A}(\alpha)+\mathscr{B}(\alpha) \ \ \ (\alpha \in V)\)

    线性变换的和还是线性变换

    • 交换律 \(\mathscr{A}+\mathscr{B}=\mathscr{B}+\mathscr{A}\)
    • 结合律 \((\mathscr{A}+\mathscr{B})+\mathscr{C}=\mathscr{A}+(\mathscr{B}+\mathscr{C})\)
    • 零变换\(\mathscr{0}\) \(\mathscr{A}+\mathscr{0}=\mathscr{A}\)
    • 负变换 \(\mathscr{A}+(-\mathscr{A})=\mathscr{0}\) .负变换也是线性的。

线性变换乘法对加法具有左右分配律

​ \(\mathscr{A}(\mathscr{B}+\mathscr{C})=\mathscr{A}\mathscr{B}+\mathscr{A}\mathscr{C}\)

​ \((\mathscr{B}+\mathscr{C})\mathscr{A}=\mathscr{B}\mathscr{A}+\mathscr{C}\mathscr{A}\)

数量乘法

  • 数域\(P\)中的数与线性变换的数量乘法为 \(k\mathscr{A}=\mathscr{K}\mathscr{A}\)
    • \((kl)\mathscr{A}=k(l\mathscr{A})\)
    • \((k+l)\mathscr{A}=k\mathscr{A}+l\mathscr{A}\)
    • \(k(\mathscr{A}+\mathscr{B})=k\mathscr{A}+k\mathscr{B}\)
    • \(1\mathscr{A}=\mathscr{A}\)

线性空间\(V\)上全体线性变换,对于如上定义的加法与数量乘法,也构成数域\(P\)上的一个线性空间

高等代数7 线性变换

逆变换

  • \(V\)上的变换\(\mathscr{A}\)称为可逆的,如果有\(V\)的变换\(\mathscr{B}\)存在,使 \(\mathscr{A}\mathscr{B}=\mathscr{B}\mathscr{A}=\mathscr{E}\)

    这时,变换\(\mathscr{A}\)称为\(\mathscr{A}\)的逆变换,称为\(\mathscr{A}^{-1}\)

    如果线性变换\(\mathscr{A}\)是可逆的,那么它的逆变换\(\mathscr{A}^{-1}\)也是线性变换

多项式

  • \(\mathscr{A}^n=\mathscr{A}\mathscr{A}\cdots\mathscr{A}(n个)\),\(\mathscr{A}^n\)称为\(\mathscr{A}\)的\(n\)次幂

    • \(\mathscr{A}^0=\mathscr{A}\)

    • 指数法则 \(\mathscr{A}^{n+m}=\mathscr{A}^n\mathscr{A}^m \\ (\mathscr{A}^m)^n=\mathscr{A}^mn\)

    • 注意 一般来说, \((\mathscr{A}\mathscr{B})^n \neq \mathscr{A}^n \mathscr{B}^n\)

  • 多项式

    设 \(f(x)=a_mx^m+a_{m-1}x^{m-1}+\cdots+a_0x^0\)是\(P[x]\)中的一个多项式, \(\mathscr{A}\)是\(V\)的一线性变换

    ​ \(f(\mathscr{A})=a_m\mathscr{A}^m+a_{m-1}\mathscr{A}^{m-1}+\cdots+a_0\mathscr{A}^0\)是一线性变换,它称为线性变换\(\mathscr{A}\)的多项式

    • 如果在\(P[x]\)中,\(h(x)=f(x)+g(x),p(x)=f(x)g(x)\),那么\(h(\mathscr{A})=f(\mathscr{A})+g(\mathscr{A}),p(\mathscr{A})=f(\mathscr{A})g(\mathscr{A})\)
    • 可交换 \(f(\mathscr{A})g(\mathscr{A})=g(\mathscr{A})f(\mathscr{A})\) 即同一个线性变换的多项式的乘法是可交换的。

线性变换的矩阵

高等代数7 线性变换

线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵

  1. 设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基。

    如果线性变换\(\mathscr{A}\)与\(\mathscr{B}\)在这组基上的作用相同,即\(\mathscr{A}\varepsilon_i=\mathscr{B}\varepsilon_i,\ \ i=1,2,\cdots,n\) 那么\(\mathscr{A}=\mathscr{B}\)。

    意义:一个线性变换完全被它在一组基上的作用决定

  2. 设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基。

    对于任意一组向量\(\alpha_1,\alpha_2,\cdots,\alpha_n\),一定有一个线性变换\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)

    意义:基向量的像完全可以是任意的

  • 定理

    设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基,\(\alpha_1,\alpha_2,\cdots,\alpha_n\)是\(V\)中的任意\(n\)个向量。

    存在唯一的线性变换\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)

  • 定义

    设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是数域\(P\)上\(n\)维线性空间\(V\)的一组基,\(\mathscr{A}\)是\(V\)的一个线性变换。

    基向量的像可以被基线性表出:

    \[\begin{cases} \mathscr{A}\varepsilon_1=a_{11}\varepsilon_1 +a_{12}\varepsilon_2+\cdots +a_{1n}\varepsilon_n \\ \mathscr{A}\varepsilon_2=a_{21}\varepsilon_1 +a_{22}\varepsilon_2+\cdots +a_{2n}\varepsilon_n \\ \ \ \ \cdots \cdots \\ \mathscr{A}\varepsilon_n=a_{n1}\varepsilon_1 +a_{n2}\varepsilon_2+\cdots +a_{nn}\varepsilon_n \\ \end{cases} \\ \mathscr{A}(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) =(\mathscr{A}\varepsilon_1,\mathscr{A}\varepsilon_2,\cdots,\mathscr{A}\varepsilon_n) =(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \\ A= \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \]

    其中\(A\)称为线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵

在取定一组基后,我们就建立了由数域\(P\)上的\(n\)维线性空间\(V\)的线性变换到数域\(P\)上的\(n \times n\)矩阵的一个映射,1说明这个映射是单射,2说明是满射,因此这个映射是一一对应的(双射)。

  • 定理

    设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是数域\(P\)上\(n\)维线性空间\(V\)的一组基,在这组基下,每个线性变换按着公式(3)对应一个\(n \times n\)矩阵。这个对应具有以下性质:

    1. 线性变换的和对应矩阵的和;
    2. 线性变换的乘积对应矩阵的乘积;
    3. 线性变换的数量乘积对应矩阵的数量乘积;
    4. 可逆的线性变换与可逆矩阵对应,且逆变换对应逆矩阵。

    定理说明,数域\(P\)上\(n\)维线性空间\(V\)的全部线性变换构成的集合\(L(V)\)对于线性变换的加法与数量乘法构成\(P\)上一个线性空间,与数域\(P\)上\(n\)级方阵构成的线性空间\(P^{n \times n}\)同构。

    高等代数7 线性变换

线性变换的矩阵计算向量的像

  • 定理

    设线性变换\(\mathscr{A}\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的矩阵是\(A\),向量\(\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标是\((x_1,x_2,\cdots,x_n)\),

    则\(\mathscr{A}\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标\((y_1,y_2,\cdots,y_n)\)可以按公式

    \[\left ( \begin{matrix} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \\ \end{matrix} \right ) =A \left ( \begin{matrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \\ \end{matrix} \right ) \]

    计算。

线性变换的矩阵与基的关系

  • 定理

    线性空间\(V\)的线性变换\(\mathscr{A}\)在两组基

    \[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n \\ \eta_1,\eta_2,\cdots,\eta_n \]

    下的矩阵分别是\(A,B\),从基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)到基\(\eta_1,\eta_2,\cdots,\eta_n\)的过渡矩阵是\(X\),于是\(B=X^{-1}AX\).

    这个定理告诉我们,同一个线性变换\(\mathscr{A}\)在不同基下的矩阵之间的关系。

相似

  • 定义 相似

    设\(A、B\)是数域\(P\)上两个\(n\)级矩阵,如果可以找到数域\(P\)上的\(n\)级可逆矩阵\(X\),使得\(B=X^{-1}AX\),就说\(A\)相似于\(B\),记作\(A \sim B\)

  • 性质

    1. 自反性 \(A\sim A\)
    2. 对称性 \(A \sim B ,B \sim A\)
    3. 传递性 \(A \sim B ,B \sim C\),则\(A \sim C\)
  • 定理

    线性变换在不同基下所对应的矩阵是相似的。

    如果两个矩阵相似,那么它们可以看作同一个线性变换在两组基下所对应的矩阵。

  • 运算性质

    如果\(B_1=X^{-1}A_1X,B_2=X^{-1}A_2X\),那么

    1. ​ \(B_1+B_2=X^{-1}(A_1+A_2)X\)
    2. ​ \(B_1B_2=X^{-1}(A_1A_2)X\)
    3. ​ 若\(f(x)\)是数域\(P\)上一多项式 \(f(B)=X^{-1}f(A)X\)

特征值与特征向量

定义

适当选择一组基后,一个线性变换的矩阵可以化成什么样的简单形式

  • 定义 特征值、特征向量

    设\(\mathscr{A}\)数域\(P\)上\(n\)维线性空间\(V\)的一个线性变换,如果对于数域\(P\)中一数\(\lambda_0\),存在一个非零向量\(\xi\),使得

    \[\mathscr{A}\xi= \lambda_0\xi \]

    那么\(\lambda_0\)称为\(\mathscr{A}\)的一个特征值,而\(\xi\)称为\(\mathscr{A}\)的属于特征值\(\lambda_0\)的一个特征向量

特征值是被特征向量唯一决定的,一个特征向量只能属于一个特征值。

寻找特征值和特征向量的方法

  • 定义 特征多项式

    设\(A\)是数域\(P\)上一\(n\)级矩阵,\(\lambda\)是一个文字。

    矩阵\(\lambda E-A\)的行列式

    \[|\lambda E-A| =\left | \begin{matrix} \lambda-a_{11} &- a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ - a_{s1} & -a_{s2} & \cdots & \lambda-a_{sn} \\ \end{matrix} \right | \]

    称为\(A\)的特征多项式

    这是数域\(P\)上的一个\(n\)次多项式。

求特征值\(\lambda_0\)与特征向量\(\xi\)

  1. 取一组基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\),写\(\mathscr{A}\)在这组基下的矩阵\(A\);

  2. 求出特征多项式\(|\lambda E-A|\)的根\(\lambda=(\lambda_1,\lambda_2,\cdots,\lambda_n)\),(\(\lambda\)是线性变换\(\mathscr{A}\)的全部特征值);

  3. 将特征值带入方程组

    \[(\lambda_i E-A)\left ( \begin{matrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \\ \end{matrix} \right )=0 \\ \begin{cases} (\lambda_0 -a_{11})x_1 +a_{12}x_2+\cdots +a_{1n}x_n=0 \\ a_{21}x_1 +(\lambda_0-a_{22})x_2+\cdots +a_{2n}x_n=0 \\ \ \ \ \cdots \cdots \\ a_{n1}x_1 +a_{n2}x_2+\cdots +(\lambda_0-a_{nn})x_n=0 \\ \end{cases} \]

    解得基础解系\((x_1,x_2,\cdots,x_n)_i\)。(也就是特征向量\(\xi_i\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标)

    \(\xi_i=x_1\varepsilon_1+x_2\varepsilon_2+\cdots+x_n\varepsilon_n\)

特征子空间

  • 定义

    线性变换\(\mathscr{A}\)的任一个特征值\(\lambda_0\),全部适合条件 \(\mathscr{A}\alpha=\lambda_0 \alpha\)的向量\(\alpha\)所组成的集合,也就是\(\mathscr{A}\)的属于\(\lambda_0\)的全部特征向量再添上零向量组成的集合,是\(V\)的一个子空间,称为\(\mathscr{A}\)的一个特征子空间,记作\(V_{\lambda_0}\).

    \(V_{\lambda_0}\)的维数就是属于\(\lambda_0\)的线性无关的特征向量的最大个数。

    用集合表示可写为\(V_{\lambda_0}=\{\alpha|\mathscr{A}\alpha=\lambda_0 \alpha ,\alpha \in V\}\)

特征多项式

\[|\lambda E-A| =\left | \begin{matrix} \lambda-a_{11} &- a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ - a_{s1} & -a_{s2} & \cdots & \lambda-a_{sn} \\ \end{matrix} \right | \]

  • \(A\)的全体特征值的和为\(a_{11}+a_{22}+\cdots+a_{nn}\),称为\(A\)的迹,记为\(Tr(A)\)。

  • \(A\)的全体特征值的积为\(|A|\)。

  • 定理 相似的矩阵有相同的特征多项式。

    ​ 线性变换的矩阵的特征多项式与基的选择无关,直接被线性变换决定,特征多项式可以称为线性变换的多项式

  • 哈密顿—凯莱定理

    设\(A\)是数域\(P\)上一个\(n \times n\)矩阵,\(f(\lambda)=|\lambda E-A|\)是\(A\)的特征多项式,则

    \[f(A)=A^n-(a_{11}+a_{22}+\cdots+a_{nn})A^{n-1}+\cdots+(-1)^n|A|E =O \]

对角矩阵

上一篇:高等代数6 线性空间


下一篇:Calculate Frechet