高等代数笔记5:线性变换

线性映射的定义与性质

线性映射的定义

数学研究的主题是空间与变换,对于代数学而言,空间指的是赋予了某种运算结构的集合,变换则是空间到空间的映射。线性代数则是研究线性空间及其上的映射。但是,研究的对象不是所有的映射,而是特殊的一类映射,这类映射和线性运算紧密联系,称为线性映射。

定义5.1 V1,V2V_1,V_2V1​,V2​是KKK的两个线性空间,f:V1V2f:V_1\to V_2f:V1​→V2​是V1V_1V1​到V2V_2V2​的映射,如果满足:
k1,k2K,x1,x2V1\forall k_1,k_2\in K,\forall x_1,x_2\in V_1∀k1​,k2​∈K,∀x1​,x2​∈V1​都有
f(k1x1+k2x2)=k1f(x1)+k2f(x2)f(k_1x_1+k_2x_2)=k_1f(x_1)+k_2f(x_2)f(k1​x1​+k2​x2​)=k1​f(x1​)+k2​f(x2​)则称fff是V1V_1V1​到V2V_2V2​(定义在V1V_1V1​,取值于V2V_2V2​)的线性映射

在线性代数中,我们称这类映射为线性映射,在泛函分析中,我们称这类映射为线性算子。

定义5.2 VVV是KKK的线性空间,VVV到VVV的线性映射称为VVV上的线性变换

线性变换就是线性空间自己到自己的线性映射,是一类特殊的线性映射。当然,线性映射的例子相当多,就前面的矩阵代数而言
y=Axy=Axy=Ax就是就是KnK^nKn到KmK^mKm的线性映射,平面解析几何和空间解析几何中的伸缩、旋转都是线性映射。另外,KKK也是KKK上的线性空间,VVV到KKK的线性映射是一个函数,称为线性函数,在泛函分析中称为线性泛函。在有限维线性空间的情形下,要把握一个线性映射其实相当简单。设V1V_1V1​是nnn维线性空间,e1,,ene_1,\cdots,e_ne1​,⋯,en​是V1V_1V1​的一组基,V2V_2V2​是mmm维线性空间,ε1,,εm\varepsilon_1,\cdots,\varepsilon_mε1​,⋯,εm​是V2V_2V2​的一组基。对任意的xV1x\in V_1x∈V1​,xxx可唯一表为
x=k1e1++knenx=k_1e_1+\cdots+k_ne_nx=k1​e1​+⋯+kn​en​对任意的线性映射f:V1V2f:V_1\to V_2f:V1​→V2​,就有
f(x)=k1f(e1)++knf(en)f(x)=k_1f(e_1)+\cdots+k_nf(e_n)f(x)=k1​f(e1​)+⋯+kn​f(en​)也就是说,要把握fff的象,只需要把握f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)即可。只要把握了基的象,全空间的象戳手可得,这是线性映射相对于其他映射的良好性质。对于一个映射,我们还关心映射是否是单射,又是否是满射。下面我们来给出判断线性映射是单射还是满射的条件。

线性映射的单射与线性空间的同构

定理5.1 V1,V2V_1,V_2V1​,V2​是KKK上的线性空间,f:V1V2f:V_1\to V_2f:V1​→V2​是线性映射,则fff是单射的充要条件是000的原象只能是000

证:
必要性是显然的,仅证充分性,如果f1(0)=0f^{-1}(0)={0}f−1(0)=0,则若f(x1)=f(x2)f(x_1)=f(x_2)f(x1​)=f(x2​),就有f(x1x2)=0f(x_1-x_2)=0f(x1​−x2​)=0,可以推出
x1x2=0x_1-x_2=0x1​−x2​=0因此fff是单射

我们注意到,线性映射是否是单射,只与000的原象有关系,我们定义
ker(f)={xV1:f(x)=0}\ker(f) = \{x\in V_1:f(x)=0\}ker(f)={x∈V1​:f(x)=0}容易验证ker(f)\ker(f)ker(f)是V1V_1V1​的子空间,如果ker(f)={0}\ker(f)=\{0\}ker(f)={0},那么fff是单射,否则不是单射。ker(f)\ker(f)ker(f)又称为fff的核空间或零空间。我们知道,把握f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)就可以把握线性映射的像,因此,又可以从f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)的线性相关性和线性无关性给出判断单射的条件。

定理5.2 V1,V2V_1,V_2V1​,V2​是KKK上的线性空间,f:V1V2f:V_1\to V_2f:V1​→V2​是线性映射,e1,,ene_1,\cdots,e_ne1​,⋯,en​是V1V_1V1​的一组基,则fff是单射的充分必要条件是f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)线性无关

证:
充分性,如果f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)线性无关,对任意的x=x1e1++xnenx=x_1e_1+\cdots+x_ne_nx=x1​e1​+⋯+xn​en​,若满足f(x)=0f(x)=0f(x)=0,则
x1f(e1)+x2f(e2)++xnf(en)=0x_1f(e_1)+x_2f(e_2)+\cdots+x_nf(e_n)=0x1​f(e1​)+x2​f(e2​)+⋯+xn​f(en​)=0由f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)线性无关,可以推出x1=x2==xn=0x_1=x_2=\cdots=x_n=0x1​=x2​=⋯=xn​=0,x=0x=0x=0,因此,fff是单射
必要性,如果fff是单射,而f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)线性相关,存在不全为0的k1,,knk_1,\cdots,k_nk1​,⋯,kn​,使得
k1f(e1)++knf(en)=f(k1e1++knen)=0k_1f(e_1)+\cdots+k_nf(e_n)=f(k_1e_1+\cdots+k_ne_n)=0k1​f(e1​)+⋯+kn​f(en​)=f(k1​e1​+⋯+kn​en​)=0令x=k1e1++knenx=k_1e_1+\cdots+k_ne_nx=k1​e1​+⋯+kn​en​,x0x\neq 0x​=0,ker(f){0}\ker(f)\neq \{0\}ker(f)​={0},fff不是单射,矛盾,因此,f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)线性无关

如果线性映射fff即是单射,又是满射,那么fff的逆映射存在。并且,容易验证:f1f^{-1}f−1也是线性映射。设V1V_1V1​的一组基为e1,,ene_1,\cdots,e_ne1​,⋯,en​,由于fff是单射,这样,就可以得出结论:f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)线性无关,但fff又是满射,任意yV2y\in V_2y∈V2​都可以找到原象,从而可以得出结论:f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​)是V2V_2V2​的一组基,fff在两组基之间搭起一个桥梁,这样,我们可以视V1,V2V_1,V_2V1​,V2​为同一个线性空间,只不过,在V1V_1V1​上,基表现为e1,,ene_1,\cdots,e_ne1​,⋯,en​,在V2V_2V2​上,基表现f(e1),,f(en)f(e_1),\cdots,f(e_n)f(e1​),⋯,f(en​),两个线性空间除了元素的形式不同外,没有其他本质的差别,就称V1,V2V_1,V_2V1​,V2​同构。

定义5.3 V1,V2V_1,V_2V1​,V2​是KKK上的两个线性空间,如果存在V1V_1V1​到V2V_2V2​的线性映射fff,fff既是单射,又是满射,则称fff是V1V_1V1​到V2V_2V2​的同构映射,V1V_1V1​和V2V_2V2​同构

通过前面论述又不难有以下结论:

命题5.1 V1,V2V_1,V_2V1​,V2​是KKK上的两个有限维线性空间,V1,V2V_1,V_2V1​,V2​同构的充分必要条件为dim(V1)=dim(V2)\dim(V_1)=\dim(V_2)dim(V1​)=dim(V2​)

证:
必要性前面已经证明,仅证充分性:
dim(V1)=dim(V2)\dim(V_1)=\dim(V_2)dim(V1​)=dim(V2​),要证明V1,V2V_1,V_2V1​,V2​同构,就要构造V1V_1V1​到V2V_2V2​的一个同构映射,设e1,,ene_1,\cdots,e_ne1​,⋯,en​是V1V_1V1​的一组基,ε1,,εn\varepsilon_1,\cdots,\varepsilon_nε1​,⋯,εn​是V2V_2V2​的一组基,构造映射f:V1V2f:V_1\to V_2f:V1​→V2​:
f(k1e1++knen)=k1ε1++knεnf(k_1e_1+\cdots+k_ne_n)=k_1\varepsilon_1+\cdots+k_n\varepsilon_nf(k1​e1​+⋯+kn​en​)=k1​ε1​+⋯+kn​εn​则f(ei)=εi,i=1,,nf(e_i)=\varepsilon_i,i=1,\cdots,nf(ei​)=εi​,i=1,⋯,n,并且fff是线性映射,并且由构造容易知道fff既是单射,又是满射。

于是,任意KKK上的nnn维线性空间,都与KnK^nKn同构,从某种意义上来看,虽然抽象的线性空间十分抽象,不好把握,但是,其实质就是nnn维向量空间。

线性映射的运算的空间

线性映射也可以作为集合的元素构成线性空间。我们记V1V2V_1\to V_2V1​→V2​的全体线性映射为M(V1,V2)M(V_1,V_2)M(V1​,V2​),记VVV上的线性变换为M(V)M(V)M(V)。f1,f2M(V1,V2)f_1,f_2\in M(V_1,V_2)f1​,f2​∈M(V1​,V2​),定义f1+f2:V1V2f_1+f_2:V_1\to V_2f1​+f2​:V1​→V2​,对任意的xV1x\in V_1x∈V1​:
(f1+f2)(x)=f1(x)+f2(x)(f_1+f_2)(x)=f_1(x)+f_2(x)(f1​+f2​)(x)=f1​(x)+f2​(x)对任意的kKk\in Kk∈K,定义kf:V1V2kf:V_1\to V_2kf:V1​→V2​,对任意的xV1x\in V_1x∈V1​:
(kf)(x)=kf(x)(kf)(x)=kf(x)(kf)(x)=kf(x)只需要验证其满足线性空间的八条运算性质即可:
(1)(f1+f2)(x)=f1(x)+f2(x)=f2(x)+f1(x)=(f2+f1)(x),xV1(f_1+f_2)(x)=f_1(x)+f_2(x)=f_2(x)+f_1(x)=(f_2+f_1)(x),\forall x\in V_1(f1​+f2​)(x)=f1​(x)+f2​(x)=f2​(x)+f1​(x)=(f2​+f1​)(x),∀x∈V1​
(2)(f1+f2+f3)(x)=f1(x)+f2(x)+f3(x)=f1(x)+(f2(x)+f3(x))=(f1+(f2+f3))(x)(f_1+f_2+f_3)(x)=f_1(x)+f_2(x)+f_3(x)=f_1(x)+(f_2(x)+f_3(x))=(f_1+(f_2+f_3))(x)(f1​+f2​+f3​)(x)=f1​(x)+f2​(x)+f3​(x)=f1​(x)+(f2​(x)+f3​(x))=(f1​+(f2​+f3​))(x)
(3)0:V1V20:V_1\to V_20:V1​→V2​定义成任意元素都映射为0,0+f=f0+f=f0+f=f
(4)fM(V1,V2),f=(1).f\forall f \in M(V_1,V_2),-f = (-1).f∀f∈M(V1​,V2​),−f=(−1).f
其他四条验证是类似的,M(V1,V2)M(V_1,V_2)M(V1​,V2​)构成一个线性空间,自然地,M(V)M(V)M(V)也是一个线性空间。

M(V)M(V)M(V)有着一般线性空间没有的运算就是运算的复合,就是运算的乘法。f1,f2M(V)\forall f_1,f_2\in M(V)∀f1​,f2​∈M(V),f1f2f_1f_2f1​f2​定义为xV\forall x \in V∀x∈V,(f1f2)(x)=f1(f2(x))(f_1f_2)(x)=f_1(f_2(x))(f1​f2​)(x)=f1​(f2​(x)),容易验证f1f2f_1f_2f1​f2​还是VVV上的线性变换,这样,M(V)M(V)M(V)上可以定义出多项式。这里我们不再做详细的论述。

线性映射与矩阵

下面我们讨论线性映射和矩阵的关系。假设fff是V1V_1V1​到V2V_2V2​的线性映射,其中,V1V_1V1​和V2V_2V2​都是KKK上的有限维线性空间,dim(V1)=n\dim(V_1)=ndim(V1​)=n,dim(V2)=m\dim(V_2)=mdim(V2​)=m,设e1,,ene_1,\cdots,e_ne1​,⋯,en​是V1V_1V1​的一组基,b1,,bmb_1,\cdots,b_mb1​,⋯,bm​是V2V_2V2​的一组基。则
{f(e1)=a11b1++a1mbmf(e2)=a21b1++a2mbmf(en)=an1b1++anmbm \begin{cases} f(e_1)=a_{11}b_1+\cdots+a_{1m}b_m\\ f(e_2)=a_{21}b_1+\cdots+a_{2m}b_m\\ \cdots\\ f(e_n)=a_{n1}b_1+\cdots+a_{nm}b_m \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧​f(e1​)=a11​b1​+⋯+a1m​bm​f(e2​)=a21​b1​+⋯+a2m​bm​⋯f(en​)=an1​b1​+⋯+anm​bm​​可以看到,以上方程式就类似于线性方程组,我们也写成形式矩阵乘法的形式:
f(e1,,en)=(b1,,bm)A f(e_1,\cdots,e_n)=(b_1,\cdots,b_m)A f(e1​,⋯,en​)=(b1​,⋯,bm​)A其中矩阵
A=[a11a21an1a12a22an2a1ma2manm] A=\left[ \begin{matrix} a_{11}&a_{21}&\cdots&a_{n1}\\ a_{12}&a_{22}&\cdots&a_{n2}\\ \cdots\\ a_{1m}&a_{2m}&\cdots&a_{nm} \end{matrix}\right] A=⎣⎢⎢⎡​a11​a12​⋯a1m​​a21​a22​a2m​​⋯⋯⋯​an1​an2​anm​​⎦⎥⎥⎤​当然也可以写成转置的形式,这里不再赘述。AAA就称为fff在基e1,,ene_1,\cdots,e_ne1​,⋯,en​到b1,,bmb_1,\cdots,b_mb1​,⋯,bm​下的矩阵。如果fff是VVV上的线性变换,dim(V)=n<\dim(V)=n<\inftydim(V)=n<∞,任取e1,,ene_1,\cdots,e_ne1​,⋯,en​为VVV的一组基,则
{f(e1)=a11e1+a12e2++a1nenf(e2)=a21e1+a22e2++a2nenf(en)=an1e1+an2e2++annen \begin{cases} f(e_1)=a_{11}e_1+a_{12}e_2+\cdots+a_{1n}e_n\\ f(e_2)=a_{21}e_1+a_{22}e_2+\cdots+a_{2n}e_n\\ \cdots\\ f(e_n)=a_{n1}e_1+a_{n2}e_2+\cdots+a_{nn}e_n \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧​f(e1​)=a11​e1​+a12​e2​+⋯+a1n​en​f(e2​)=a21​e1​+a22​e2​+⋯+a2n​en​⋯f(en​)=an1​e1​+an2​e2​+⋯+ann​en​​写成形式矩阵的形式即为
f(e1,,en)=(e1,,en)Af(e_1,\cdots,e_n)=(e_1,\cdots,e_n)Af(e1​,⋯,en​)=(e1​,⋯,en​)A
其中
A=[a11a21an1a12a22an2a1na2nann] A=\left[\begin{matrix} a_{11}&a_{21}&\cdots&a_{n1}\\ a_{12}&a_{22}&\cdots&a_{n2}\\ \cdots\\ a_{1n}&a_{2n}&\cdots&a_{nn} \end{matrix}\right] A=⎣⎢⎢⎡​a11​a12​⋯a1n​​a21​a22​a2n​​⋯⋯⋯​an1​an2​ann​​⎦⎥⎥⎤​AAA就称为线性变换fff在e1,,ene_1,\cdots,e_ne1​,⋯,en​下的矩阵。对线性映射,我们需要两组基确定一个矩阵,但对线性变换,只需要一组基就可以确定一个矩阵。对线性映射f:V1V2f:V_1\to V_2f:V1​→V2​,对于确定的两组基,就可以确定一个唯一的矩阵,反过来,给定两组基,给定一个矩阵,可以构造出一个线性映射,对于线性变换亦是如此,这就说明,线性映射空间M(V1,V2)M(V_1,V_2)M(V1​,V2​)和相应的矩阵空间是一一对应的,并且还是线性同构的,容易验证:α1f1+α2f2\alpha_1f_1+\alpha_2f_2α1​f1​+α2​f2​在两组基下的矩阵等于各自在这两组基下矩阵的线性组合,说明M(V1,V2)M(V_1,V_2)M(V1​,V2​)到矩阵空间的这一一对一映射还是线性映射。为了说明这点,我们简单验证一点性质即可
f,gf,gf,g是V1V_1V1​到V2V_2V2​的线性映射,e1,,ene_1,\cdots,e_ne1​,⋯,en​是V1V_1V1​的一组基,ε1,,εm\varepsilon_1,\cdots,\varepsilon_mε1​,⋯,εm​是V2V_2V2​的一组基,fff在e1,,ene_1,\cdots,e_ne1​,⋯,en​到ε1,,εm\varepsilon_1,\cdots,\varepsilon_mε1​,⋯,εm​的矩阵是AAA,而ggg在两组基下的矩阵是BBB,则αf+βg\alpha f+\beta gαf+βg在这两组基下的矩阵为αA+βB\alpha A+\beta BαA+βB。
假设A=(aij),B=(bij)A=(a_{ij}),B=(b_{ij})A=(aij​),B=(bij​),则
f(ej)=i=1maijεij=1,,nf(e_j)=\sum_{i=1}^m{a_{ij}\varepsilon_i}\quad j=1,\cdots,nf(ej​)=i=1∑m​aij​εi​j=1,⋯,n同样地
g(ej)=i=1mbijεij=1,,ng(e_j)=\sum_{i=1}^m{b_{ij}\varepsilon_i}\quad j=1,\cdots,ng(ej​)=i=1∑m​bij​εi​j=1,⋯,n于是,就有
(αf+βg)(ej)=i=1m(αaij+βbij)εij=1,,n(\alpha f+\beta g)(e_j)= \sum_{i=1}^m{(\alpha a_{ij}+\beta b_{ij})\varepsilon_i}\quad j=1,\cdots,n(αf+βg)(ej​)=i=1∑m​(αaij​+βbij​)εi​j=1,⋯,n这就验证了αf+βg\alpha f+\beta gαf+βg在两组基下的矩阵为αA+βB\alpha A+\beta BαA+βB。同样地,M(V)M(V)M(V)和Mn(K)M_n(K)Mn​(K)是线性同构的。据此,我们可以提出如下的观点,在线性代数领域:
矩阵是线性映射的矩阵

矩阵和线性映射的关系可以总结为:
(1)矩阵是线性映射的矩阵,是线性映射的具体表现
(2)矩阵为线性映射的相关计算提供了手段
不仅如此,还容易验证,线性映射复合的矩阵就等于矩阵的乘法。这样,我们就把抽象的线性空间上的线性映射和具体的矩阵联系在了一起。矩阵运算都有了相应的意义。

接下来的一个问题是:对于同一个线性变换fM(V)f\in M(V)f∈M(V),其中,dim(V)=n\dim(V)=ndim(V)=n,选择不同的基,线性变换的在不同基下的矩阵有何关系呢?在引出线性映射的矩阵时,我们给出了一种形式矩阵的运算。我们先给出形式矩阵运算的一个基本性质。
e1,,ene_1,\cdots,e_ne1​,⋯,en​是VVV的一个向量组,AAA是一个nnn阶矩阵,BBB也是一个nnn阶矩阵,则
[(e1,,en)A]B=(e1,,en)(AB)[(e_1,\cdots,e_n)A]B=(e_1,\cdots,e_n)(AB)[(e1​,⋯,en​)A]B=(e1​,⋯,en​)(AB)其中AAA是n×mn\times mn×m矩阵,BBB是m×km\times km×k矩阵,只需要作简单的验证即可。设A=(aij),B=(bij)A=(a_{ij}),B=(b_{ij})A=(aij​),B=(bij​),则\
(β1,,βm)=(e1,,en)A(\beta_1,\cdots,\beta_m)=(e_1,\cdots,e_n)A(β1​,⋯,βm​)=(e1​,⋯,en​)A,则
βi=j=1naijeji=1,,m\beta_i=\sum_{j=1}^n{a_{ij}e_j}\quad i=1,\cdots,mβi​=j=1∑n​aij​ej​i=1,⋯,m再设(γ1,,γk)=(β1,,βm)B(\gamma_1,\cdots,\gamma_k)=(\beta_1,\cdots,\beta_m)B(γ1​,⋯,γk​)=(β1​,⋯,βm​)B,于是
γi=s=1mbsiβs=s=1mbsi(j=1najsej)=j=1ns=1m(ajsbsi)ej\gamma_i=\sum_{s=1}^m{b_{si}\beta_s}= \sum_{s=1}^mb_{si}(\sum_{j=1}^na_{js}e_j) =\sum_{j=1}^n\sum_{s=1}^m{(a_{js}b_{si})e_j}γi​=s=1∑m​bsi​βs​=s=1∑m​bsi​(j=1∑n​ajs​ej​)=j=1∑n​s=1∑m​(ajs​bsi​)ej​其中i=1,,ki=1,\cdots,ki=1,⋯,k,这就验证了
(γ1,,γk)=(e1,,en)(AB)(\gamma_1,\cdots,\gamma_k)=(e_1,\cdots,e_n)(AB)(γ1​,⋯,γk​)=(e1​,⋯,en​)(AB)假设线性变换fff在基e1,,ene_1,\cdots,e_ne1​,⋯,en​下的矩阵为AAA,就有
(f(e1),,f(en))=(e1,,en)A(f(e_1),\cdots,f(e_n))=(e_1,\cdots,e_n)A(f(e1​),⋯,f(en​))=(e1​,⋯,en​)A再假设β1,,βn\beta_1,\cdots,\beta_nβ1​,⋯,βn​是VVV的另一组基,设
(β1,,βn)P=(e1,,en)(\beta_1,\cdots,\beta_n)P=(e_1,\cdots,e_n)(β1​,⋯,βn​)P=(e1​,⋯,en​)同时
(β1,,βn)=(e1,,en)Q(\beta_1,\cdots,\beta_n)=(e_1,\cdots,e_n)Q(β1​,⋯,βn​)=(e1​,⋯,en​)Q于是
(e1,,en)(PQ)=(e1,,en)(e_1,\cdots,e_n)(PQ)=(e_1,\cdots,e_n)(e1​,⋯,en​)(PQ)=(e1​,⋯,en​)由于e1,,ene_1,\cdots,e_ne1​,⋯,en​是VVV的一组基,并且坐标具有唯一性,就有
QP=InQP=I_nQP=In​因此PPP可逆,并且有
f(e1,,en)=f(β1,,βn)P=(e1,,en)A=(β1,,βn)(PA)f(e_1,\cdots,e_n)=f(\beta_1,\cdots,\beta_n)P =(e_1,\cdots,e_n)A=(\beta_1,\cdots,\beta_n)(PA)f(e1​,⋯,en​)=f(β1​,⋯,βn​)P=(e1​,⋯,en​)A=(β1​,⋯,βn​)(PA)两边同右乘P1P^{-1}P−1,就有
f(β1,,βn)=(β1,,βn)(PAP1)f(\beta_1,\cdots,\beta_n)=(\beta_1,\cdots,\beta_n)(PAP^{-1})f(β1​,⋯,βn​)=(β1​,⋯,βn​)(PAP−1)实际上,PPP是(β1,,βn)(\beta_1,\cdots,\beta_n)(β1​,⋯,βn​)到(e1,,en)(e_1,\cdots,e_n)(e1​,⋯,en​)的过渡矩阵,或称基变换矩阵,P1P^{-1}P−1是\(e1,,en)(e_1,\cdots,e_n)(e1​,⋯,en​)到(β1,,βn)(\beta_1,\cdots,\beta_n)(β1​,⋯,βn​)的过渡矩阵。fff在β1,,βn\beta_1,\cdots,\beta_nβ1​,⋯,βn​下的矩阵为
B=PAP1B=PAP^{-1}B=PAP−1下面我们定义nnn阶方阵的相似关系:

定义5.4 A,BA,BA,B是数域KKK下的nnn阶方阵,如果存在nnn阶可逆方阵PPP,使得B=PAP1B=PAP^{-1}B=PAP−1则称AAA和BBB是相似矩阵

由上面的论述,同一线性变换在不同基下的矩阵是相似关系。并且容易验证:相似关系满足自反性,对称性和传递性,是一个等价关系,这样,我们就可以利用相似关系将nnn阶矩阵划分成若干个等价类。在同一等价类内,不同矩阵对应不同的一组基,自然地,我们就像寻找等价类内一组"最好"的基,使得fff在这组基下的矩阵"最简单",最好简单到对角矩阵。这就是特征值和特征向量要研究的问题。

线性变换的特征值与特征向量

特征值问题的引入

前面我们讲过,线性变换在不同基下的矩阵是相似的关系,这就启发我们去寻找一组"最好"的基,使线性变换在这组基下的矩阵"最简单",最简单的矩阵莫过于对角矩阵。即
f(e1,,en)=(e1,,en)D f(e_1,\cdots,e_n)=(e_1,\cdots,e_n)D f(e1​,⋯,en​)=(e1​,⋯,en​)D(e1,,en)(e_1,\cdots,e_n)(e1​,⋯,en​)是VVV的一组基,D=diag(λ1,,λn)D=diag(\lambda_1,\cdots,\lambda_n)D=diag(λ1​,⋯,λn​)。于是
f(ei)=λieii=1,,n f(e_i)=\lambda_i e_i \quad i=1,\cdots,n f(ei​)=λi​ei​i=1,⋯,n线性变换fff只是将eie_iei​进行了伸缩变换,对任意的x=a1e1++anenx=a_1e_1+\cdots+a_ne_nx=a1​e1​+⋯+an​en​,于是
f(x)=i=1naiλieif(x)=\sum_{i=1}^n{a_i\lambda_i e_i}f(x)=i=1∑n​ai​λi​ei​我们发现,在这组基下,线性变换变得"异常简单"。接下来线性代数的中心问题,就是寻找一组基,矩阵"最简单",本章讲述矩阵是对角阵的情形,在最后两章,我们讲述不能对角化的情况下,最简单的矩阵,即"约当标准型"。

定义5.5 VVV是KKK上的nnn维线性空间,fff是VVV上的线性变换,如果存在λK\lambda\in Kλ∈K及非零向量eVe\in Ve∈V,满足:
f(e)=λef(e)=\lambda ef(e)=λe则称λ\lambdaλ是fff的特征值,eee是λ\lambdaλ对应的特征向量

如果有nnn个线性无关的特征向量,那么自然就可以对角化,否则就不能对角化。那么,怎么寻找nnn个线性无关的特征向量呢?我们先任取一组基(e1,,en)(e_1,\cdots,e_n)(e1​,⋯,en​),设fff在这组基下的矩阵为A=(aij)A=(a_{ij})A=(aij​),设x=x1e1++xnenx=x_1e_1+\cdots+x_ne_nx=x1​e1​+⋯+xn​en​是λ\lambdaλ的特征向量。则
f(x)=(e1,,en)A(x1,,xn)T=(e1,,en)λ(x1,,xn)Tf(x) =(e_1,\cdots,e_n)A(x_1,\cdots,x_n)^T=(e_1,\cdots,e_n)\lambda(x_1,\cdots,x_n)^Tf(x)=(e1​,⋯,en​)A(x1​,⋯,xn​)T=(e1​,⋯,en​)λ(x1​,⋯,xn​)T于是得到方程组
Ax=λxAx=\lambda xAx=λx这里的xxx是nnn维列向量(x1,,xn)T(x_1,\cdots,x_n)^T(x1​,⋯,xn​)T,这个方程组由非零解等价于行列式
det(AλIn)=0\det(A-\lambda I_n)=0det(A−λIn​)=0而这个行列式是关于λ\lambdaλ的nnn次多项式,并且,并且,如果BBB和AAA相似,存在可逆矩阵PPP,使得B=PAP1B=PAP^{-1}B=PAP−1,由行列式的性质,就有
det(BIn)=det(P(AλIn)P1)=det(AλIn)\det(B-I_n)=\det(P(A-\lambda I_n)P^{-1})=\det(A-\lambda I_n)det(B−In​)=det(P(A−λIn​)P−1)=det(A−λIn​)可见特征多项式和基的选取无关,因而,特征多项式既可以称为是线性变换的特征多项式,又可以称为是矩阵的特征多项式。特征值既可以称为是线性变换的特征值,又可以称为是矩阵的特征值。并且方程组(AλIn)x=0(A-\lambda I_n)x=0(A−λIn​)x=0求解出来的nnn维向量是特征向量对应的坐标,这样我们就得到了特征向量和特征值的计算方法。下面我们引入特征空间的概念,对于λK\lambda\in Kλ∈K,称
Vλ={x:f(x)=λx}V_{\lambda}=\{x:f(x)=\lambda x\}Vλ​={x:f(x)=λx}为λ\lambdaλ对应的特征空间,容易验证特征空间是子空间,如果λ\lambdaλ不是特征值,特征空间是零空间,如果是特征值,特征空间非零,就有重数,称为λ\lambdaλ的几何重数。

可对角化的充要条件

什么情况下fff可对角化呢,很显然

定理5.4 fff是KKK上nnn维线性空间VVV上的线性变换,fff可对角化的充要条件是存在nnn个线性无关的特征向量。

假设线性变换的特征多项式为h(λ)h(\lambda)h(λ),由于hhh是nnn次多项式,由代数基本定理,hhh有nnn个复根。特征值与否当然要看数域,在复数域上一定有nnn个特征值(含重根),更小的数域则不一定。实线性空间上的线性变换的就不一定有nnn个特征值。

命题5.2 fff是KKK上nnn维线性空间VVV上的线性变换,e1,,ese_1,\cdots,e_se1​,⋯,es​是fff对应不同特征值的特征向量,则e1,,ese_1,\cdots,e_se1​,⋯,es​线性无关

证:
e1,,ese_1,\cdots,e_se1​,⋯,es​对应的特征值为λ1,,λs\lambda_1,\cdots,\lambda_sλ1​,⋯,λs​。设x1e1++xses=0x_1e_1+\cdots+x_se_s=0x1​e1​+⋯+xs​es​=0两边用fff作用
x1λ1e1++xsλses=0x_1\lambda_1e_1+\cdots+x_s\lambda_se_s=0x1​λ1​e1​+⋯+xs​λs​es​=0用数学归纳法对sss进行归纳,s=1s=1s=1时,结论显然成立。
假设s=ks=ks=k时结论成立,s=k+1s=k+1s=k+1时,第一个向量等式两边乘以λ1\lambda_1λ1​,两个向量等式相减,就可以证得结论。
由数学归纳法,结论成立。

推论5.1 fff是KKK上nnn维线性空间VVV上的线性变换,e1,,ese_1,\cdots,e_se1​,⋯,es​是sss个不同的数λ1,,λs\lambda_1,\cdots,\lambda_sλ1​,⋯,λs​特征空间中的向量,如果
e1+e2++es=0e_1+e_2+\cdots+e_s=0e1​+e2​+⋯+es​=0则e1==es=0e_1=\cdots=e_s=0e1​=⋯=es​=0

证:
如果e1,,ese_1,\cdots,e_se1​,⋯,es​不全为0,那么,至少有两个向量不为0。
不妨设至少e1,e2e_1,e_2e1​,e2​全不为0,两边用fff作用,有
λ1e1++λses=0\lambda_1e_1+\cdots+\lambda_se_s=0λ1​e1​+⋯+λs​es​=0而λ1,λ2\lambda_1,\lambda_2λ1​,λ2​不全为0,与e1,,ese_1,\cdots,e_se1​,⋯,es​中非零向量线性无关矛盾。

命题5.3 fff是KKK上nnn维线性空间VVV上的线性变换,λ1,,λs\lambda_1,\cdots,\lambda_sλ1​,⋯,λs​是fff的sss个全部不同的特征值,则fff可对角化的充要条件是各特征值几何重数的和为nnn

证:
λi(i=1,,s)\lambda_i(i=1,\cdots,s)λi​(i=1,⋯,s)特征子空间的一组基eij,j=1,,nie_{ij},j=1,\cdots,n_ieij​,j=1,⋯,ni​,令
i=1sj=1nikijeij=0\sum_{i=1}^s\sum_{j=1}^{n_i}{k_{ij}e_{ij}}=0i=1∑s​j=1∑ni​​kij​eij​=0与上面的推论,有
j=1nikijeij=0,i=1,,s \sum_{j=1}^{n_i}{k_{ij}e_{ij}}=0,i=1,\cdots,s j=1∑ni​​kij​eij​=0,i=1,⋯,s于是kij=0,i=1,,s,j=1,,nik_{ij}=0,i=1,\cdots,s,j=1,\cdots,n_ikij​=0,i=1,⋯,s,j=1,⋯,ni​,于是fff可对角化

我们已经指出,全部特征值由特征多项式det(AλIn)=0\det(A-\lambda I_n)=0det(A−λIn​)=0计算得到。特征根在多项式中的重数称为代数重数。

命题5.4 fff是KKK上nnn维线性空间VVV上的线性变换,λ0\lambda_0λ0​是fff的特征值,则其几何重数不超过其代数重数

证:
λ0\lambda_0λ0​的特征空间的几何重数为rrr,设其中一组基为e1,,ere_1,\cdots,e_re1​,⋯,er​,将其扩张为VVV的一组基e1,,ene_1,\cdots,e_ne1​,⋯,en​,则fff在这组基下的矩阵为
[λ0IrA0B]\left[\begin{matrix} \lambda_0 I_r&A\\ 0&B\\ \end{matrix}\right] [λ0​Ir​0​AB​]于是,由分块矩阵行列式计算性质,fff的特征多项式为
(λ0λ)rdet(BλInr)=0(\lambda_0-\lambda)^r\det(B-\lambda I_{n-r})=0(λ0​−λ)rdet(B−λIn−r​)=0而λ0\lambda_0λ0​还可能是det(BλInr)=0\det(B-\lambda I_{n-r})=0det(B−λIn−r​)=0的根

这说明了,fff可对角化,要满足两点:
(1)fff的特征多项式的根都在数域KKK内
(2)fff的所有特征值的代数重数都等于几何重数
同时,每个特征值的特征空间的维度至少为1,因此,就有如下的命题:

命题5.5 fff是KKK上nnn维线性空间VVV上的线性变换,如果fff有nnn个不同的特征值,则fff可对角化

上一篇:JS截取两个字符串之间及字符串前后内容的方法


下一篇:MySQL出现 ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using pa