线性映射的定义与性质
线性映射的定义
数学研究的主题是空间与变换,对于代数学而言,空间指的是赋予了某种运算结构的集合,变换则是空间到空间的映射。线性代数则是研究线性空间及其上的映射。但是,研究的对象不是所有的映射,而是特殊的一类映射,这类映射和线性运算紧密联系,称为线性映射。
定义5.1 V1,V2是K的两个线性空间,f:V1→V2是V1到V2的映射,如果满足:
∀k1,k2∈K,∀x1,x2∈V1都有
f(k1x1+k2x2)=k1f(x1)+k2f(x2)则称f是V1到V2(定义在V1,取值于V2)的线性映射
在线性代数中,我们称这类映射为线性映射,在泛函分析中,我们称这类映射为线性算子。
定义5.2 V是K的线性空间,V到V的线性映射称为V上的线性变换
线性变换就是线性空间自己到自己的线性映射,是一类特殊的线性映射。当然,线性映射的例子相当多,就前面的矩阵代数而言
y=Ax就是就是Kn到Km的线性映射,平面解析几何和空间解析几何中的伸缩、旋转都是线性映射。另外,K也是K上的线性空间,V到K的线性映射是一个函数,称为线性函数,在泛函分析中称为线性泛函。在有限维线性空间的情形下,要把握一个线性映射其实相当简单。设V1是n维线性空间,e1,⋯,en是V1的一组基,V2是m维线性空间,ε1,⋯,εm是V2的一组基。对任意的x∈V1,x可唯一表为
x=k1e1+⋯+knen对任意的线性映射f:V1→V2,就有
f(x)=k1f(e1)+⋯+knf(en)也就是说,要把握f的象,只需要把握f(e1),⋯,f(en)即可。只要把握了基的象,全空间的象戳手可得,这是线性映射相对于其他映射的良好性质。对于一个映射,我们还关心映射是否是单射,又是否是满射。下面我们来给出判断线性映射是单射还是满射的条件。
线性映射的单射与线性空间的同构
定理5.1 V1,V2是K上的线性空间,f:V1→V2是线性映射,则f是单射的充要条件是0的原象只能是0
证:
必要性是显然的,仅证充分性,如果f−1(0)=0,则若f(x1)=f(x2),就有f(x1−x2)=0,可以推出
x1−x2=0因此f是单射
我们注意到,线性映射是否是单射,只与0的原象有关系,我们定义
ker(f)={x∈V1:f(x)=0}容易验证ker(f)是V1的子空间,如果ker(f)={0},那么f是单射,否则不是单射。ker(f)又称为f的核空间或零空间。我们知道,把握f(e1),⋯,f(en)就可以把握线性映射的像,因此,又可以从f(e1),⋯,f(en)的线性相关性和线性无关性给出判断单射的条件。
定理5.2 V1,V2是K上的线性空间,f:V1→V2是线性映射,e1,⋯,en是V1的一组基,则f是单射的充分必要条件是f(e1),⋯,f(en)线性无关
证:
充分性,如果f(e1),⋯,f(en)线性无关,对任意的x=x1e1+⋯+xnen,若满足f(x)=0,则
x1f(e1)+x2f(e2)+⋯+xnf(en)=0由f(e1),⋯,f(en)线性无关,可以推出x1=x2=⋯=xn=0,x=0,因此,f是单射
必要性,如果f是单射,而f(e1),⋯,f(en)线性相关,存在不全为0的k1,⋯,kn,使得
k1f(e1)+⋯+knf(en)=f(k1e1+⋯+knen)=0令x=k1e1+⋯+knen,x=0,ker(f)={0},f不是单射,矛盾,因此,f(e1),⋯,f(en)线性无关
如果线性映射f即是单射,又是满射,那么f的逆映射存在。并且,容易验证:f−1也是线性映射。设V1的一组基为e1,⋯,en,由于f是单射,这样,就可以得出结论:f(e1),⋯,f(en)线性无关,但f又是满射,任意y∈V2都可以找到原象,从而可以得出结论:f(e1),⋯,f(en)是V2的一组基,f在两组基之间搭起一个桥梁,这样,我们可以视V1,V2为同一个线性空间,只不过,在V1上,基表现为e1,⋯,en,在V2上,基表现f(e1),⋯,f(en),两个线性空间除了元素的形式不同外,没有其他本质的差别,就称V1,V2同构。
定义5.3 V1,V2是K上的两个线性空间,如果存在V1到V2的线性映射f,f既是单射,又是满射,则称f是V1到V2的同构映射,V1和V2同构
通过前面论述又不难有以下结论:
命题5.1 V1,V2是K上的两个有限维线性空间,V1,V2同构的充分必要条件为dim(V1)=dim(V2)
证:
必要性前面已经证明,仅证充分性:
设dim(V1)=dim(V2),要证明V1,V2同构,就要构造V1到V2的一个同构映射,设e1,⋯,en是V1的一组基,ε1,⋯,εn是V2的一组基,构造映射f:V1→V2:
f(k1e1+⋯+knen)=k1ε1+⋯+knεn则f(ei)=εi,i=1,⋯,n,并且f是线性映射,并且由构造容易知道f既是单射,又是满射。
于是,任意K上的n维线性空间,都与Kn同构,从某种意义上来看,虽然抽象的线性空间十分抽象,不好把握,但是,其实质就是n维向量空间。
线性映射的运算的空间
线性映射也可以作为集合的元素构成线性空间。我们记V1→V2的全体线性映射为M(V1,V2),记V上的线性变换为M(V)。f1,f2∈M(V1,V2),定义f1+f2:V1→V2,对任意的x∈V1:
(f1+f2)(x)=f1(x)+f2(x)对任意的k∈K,定义kf:V1→V2,对任意的x∈V1:
(kf)(x)=kf(x)只需要验证其满足线性空间的八条运算性质即可:
(1)(f1+f2)(x)=f1(x)+f2(x)=f2(x)+f1(x)=(f2+f1)(x),∀x∈V1
(2)(f1+f2+f3)(x)=f1(x)+f2(x)+f3(x)=f1(x)+(f2(x)+f3(x))=(f1+(f2+f3))(x)
(3)0:V1→V2定义成任意元素都映射为0,0+f=f
(4)∀f∈M(V1,V2),−f=(−1).f
其他四条验证是类似的,M(V1,V2)构成一个线性空间,自然地,M(V)也是一个线性空间。
M(V)有着一般线性空间没有的运算就是运算的复合,就是运算的乘法。∀f1,f2∈M(V),f1f2定义为∀x∈V,(f1f2)(x)=f1(f2(x)),容易验证f1f2还是V上的线性变换,这样,M(V)上可以定义出多项式。这里我们不再做详细的论述。
线性映射与矩阵
下面我们讨论线性映射和矩阵的关系。假设f是V1到V2的线性映射,其中,V1和V2都是K上的有限维线性空间,dim(V1)=n,dim(V2)=m,设e1,⋯,en是V1的一组基,b1,⋯,bm是V2的一组基。则
⎩⎪⎪⎪⎨⎪⎪⎪⎧f(e1)=a11b1+⋯+a1mbmf(e2)=a21b1+⋯+a2mbm⋯f(en)=an1b1+⋯+anmbm可以看到,以上方程式就类似于线性方程组,我们也写成形式矩阵乘法的形式:
f(e1,⋯,en)=(b1,⋯,bm)A其中矩阵
A=⎣⎢⎢⎡a11a12⋯a1ma21a22a2m⋯⋯⋯an1an2anm⎦⎥⎥⎤当然也可以写成转置的形式,这里不再赘述。A就称为f在基e1,⋯,en到b1,⋯,bm下的矩阵。如果f是V上的线性变换,dim(V)=n<∞,任取e1,⋯,en为V的一组基,则
⎩⎪⎪⎪⎨⎪⎪⎪⎧f(e1)=a11e1+a12e2+⋯+a1nenf(e2)=a21e1+a22e2+⋯+a2nen⋯f(en)=an1e1+an2e2+⋯+annen写成形式矩阵的形式即为
f(e1,⋯,en)=(e1,⋯,en)A
其中
A=⎣⎢⎢⎡a11a12⋯a1na21a22a2n⋯⋯⋯an1an2ann⎦⎥⎥⎤A就称为线性变换f在e1,⋯,en下的矩阵。对线性映射,我们需要两组基确定一个矩阵,但对线性变换,只需要一组基就可以确定一个矩阵。对线性映射f:V1→V2,对于确定的两组基,就可以确定一个唯一的矩阵,反过来,给定两组基,给定一个矩阵,可以构造出一个线性映射,对于线性变换亦是如此,这就说明,线性映射空间M(V1,V2)和相应的矩阵空间是一一对应的,并且还是线性同构的,容易验证:α1f1+α2f2在两组基下的矩阵等于各自在这两组基下矩阵的线性组合,说明M(V1,V2)到矩阵空间的这一一对一映射还是线性映射。为了说明这点,我们简单验证一点性质即可
f,g是V1到V2的线性映射,e1,⋯,en是V1的一组基,ε1,⋯,εm是V2的一组基,f在e1,⋯,en到ε1,⋯,εm的矩阵是A,而g在两组基下的矩阵是B,则αf+βg在这两组基下的矩阵为αA+βB。
假设A=(aij),B=(bij),则
f(ej)=i=1∑maijεij=1,⋯,n同样地
g(ej)=i=1∑mbijεij=1,⋯,n于是,就有
(αf+βg)(ej)=i=1∑m(αaij+βbij)εij=1,⋯,n这就验证了αf+βg在两组基下的矩阵为αA+βB。同样地,M(V)和Mn(K)是线性同构的。据此,我们可以提出如下的观点,在线性代数领域:
矩阵是线性映射的矩阵
矩阵和线性映射的关系可以总结为:
(1)矩阵是线性映射的矩阵,是线性映射的具体表现
(2)矩阵为线性映射的相关计算提供了手段
不仅如此,还容易验证,线性映射复合的矩阵就等于矩阵的乘法。这样,我们就把抽象的线性空间上的线性映射和具体的矩阵联系在了一起。矩阵运算都有了相应的意义。
接下来的一个问题是:对于同一个线性变换f∈M(V),其中,dim(V)=n,选择不同的基,线性变换的在不同基下的矩阵有何关系呢?在引出线性映射的矩阵时,我们给出了一种形式矩阵的运算。我们先给出形式矩阵运算的一个基本性质。
e1,⋯,en是V的一个向量组,A是一个n阶矩阵,B也是一个n阶矩阵,则
[(e1,⋯,en)A]B=(e1,⋯,en)(AB)其中A是n×m矩阵,B是m×k矩阵,只需要作简单的验证即可。设A=(aij),B=(bij),则\
令(β1,⋯,βm)=(e1,⋯,en)A,则
βi=j=1∑naijeji=1,⋯,m再设(γ1,⋯,γk)=(β1,⋯,βm)B,于是
γi=s=1∑mbsiβs=s=1∑mbsi(j=1∑najsej)=j=1∑ns=1∑m(ajsbsi)ej其中i=1,⋯,k,这就验证了
(γ1,⋯,γk)=(e1,⋯,en)(AB)假设线性变换f在基e1,⋯,en下的矩阵为A,就有
(f(e1),⋯,f(en))=(e1,⋯,en)A再假设β1,⋯,βn是V的另一组基,设
(β1,⋯,βn)P=(e1,⋯,en)同时
(β1,⋯,βn)=(e1,⋯,en)Q于是
(e1,⋯,en)(PQ)=(e1,⋯,en)由于e1,⋯,en是V的一组基,并且坐标具有唯一性,就有
QP=In因此P可逆,并且有
f(e1,⋯,en)=f(β1,⋯,βn)P=(e1,⋯,en)A=(β1,⋯,βn)(PA)两边同右乘P−1,就有
f(β1,⋯,βn)=(β1,⋯,βn)(PAP−1)实际上,P是(β1,⋯,βn)到(e1,⋯,en)的过渡矩阵,或称基变换矩阵,P−1是\(e1,⋯,en)到(β1,⋯,βn)的过渡矩阵。f在β1,⋯,βn下的矩阵为
B=PAP−1下面我们定义n阶方阵的相似关系:
定义5.4 A,B是数域K下的n阶方阵,如果存在n阶可逆方阵P,使得B=PAP−1则称A和B是相似矩阵
由上面的论述,同一线性变换在不同基下的矩阵是相似关系。并且容易验证:相似关系满足自反性,对称性和传递性,是一个等价关系,这样,我们就可以利用相似关系将n阶矩阵划分成若干个等价类。在同一等价类内,不同矩阵对应不同的一组基,自然地,我们就像寻找等价类内一组"最好"的基,使得f在这组基下的矩阵"最简单",最好简单到对角矩阵。这就是特征值和特征向量要研究的问题。
线性变换的特征值与特征向量
特征值问题的引入
前面我们讲过,线性变换在不同基下的矩阵是相似的关系,这就启发我们去寻找一组"最好"的基,使线性变换在这组基下的矩阵"最简单",最简单的矩阵莫过于对角矩阵。即
f(e1,⋯,en)=(e1,⋯,en)D(e1,⋯,en)是V的一组基,D=diag(λ1,⋯,λn)。于是
f(ei)=λieii=1,⋯,n线性变换f只是将ei进行了伸缩变换,对任意的x=a1e1+⋯+anen,于是
f(x)=i=1∑naiλiei我们发现,在这组基下,线性变换变得"异常简单"。接下来线性代数的中心问题,就是寻找一组基,矩阵"最简单",本章讲述矩阵是对角阵的情形,在最后两章,我们讲述不能对角化的情况下,最简单的矩阵,即"约当标准型"。
定义5.5 V是K上的n维线性空间,f是V上的线性变换,如果存在λ∈K及非零向量e∈V,满足:
f(e)=λe则称λ是f的特征值,e是λ对应的特征向量
如果有n个线性无关的特征向量,那么自然就可以对角化,否则就不能对角化。那么,怎么寻找n个线性无关的特征向量呢?我们先任取一组基(e1,⋯,en),设f在这组基下的矩阵为A=(aij),设x=x1e1+⋯+xnen是λ的特征向量。则
f(x)=(e1,⋯,en)A(x1,⋯,xn)T=(e1,⋯,en)λ(x1,⋯,xn)T于是得到方程组
Ax=λx这里的x是n维列向量(x1,⋯,xn)T,这个方程组由非零解等价于行列式
det(A−λIn)=0而这个行列式是关于λ的n次多项式,并且,并且,如果B和A相似,存在可逆矩阵P,使得B=PAP−1,由行列式的性质,就有
det(B−In)=det(P(A−λIn)P−1)=det(A−λIn)可见特征多项式和基的选取无关,因而,特征多项式既可以称为是线性变换的特征多项式,又可以称为是矩阵的特征多项式。特征值既可以称为是线性变换的特征值,又可以称为是矩阵的特征值。并且方程组(A−λIn)x=0求解出来的n维向量是特征向量对应的坐标,这样我们就得到了特征向量和特征值的计算方法。下面我们引入特征空间的概念,对于λ∈K,称
Vλ={x:f(x)=λx}为λ对应的特征空间,容易验证特征空间是子空间,如果λ不是特征值,特征空间是零空间,如果是特征值,特征空间非零,就有重数,称为λ的几何重数。
可对角化的充要条件
什么情况下f可对角化呢,很显然
定理5.4 f是K上n维线性空间V上的线性变换,f可对角化的充要条件是存在n个线性无关的特征向量。
假设线性变换的特征多项式为h(λ),由于h是n次多项式,由代数基本定理,h有n个复根。特征值与否当然要看数域,在复数域上一定有n个特征值(含重根),更小的数域则不一定。实线性空间上的线性变换的就不一定有n个特征值。
命题5.2 f是K上n维线性空间V上的线性变换,e1,⋯,es是f对应不同特征值的特征向量,则e1,⋯,es线性无关
证:
设e1,⋯,es对应的特征值为λ1,⋯,λs。设x1e1+⋯+xses=0两边用f作用
x1λ1e1+⋯+xsλses=0用数学归纳法对s进行归纳,s=1时,结论显然成立。
假设s=k时结论成立,s=k+1时,第一个向量等式两边乘以λ1,两个向量等式相减,就可以证得结论。
由数学归纳法,结论成立。
推论5.1 f是K上n维线性空间V上的线性变换,e1,⋯,es是s个不同的数λ1,⋯,λs特征空间中的向量,如果
e1+e2+⋯+es=0则e1=⋯=es=0
证:
如果e1,⋯,es不全为0,那么,至少有两个向量不为0。
不妨设至少e1,e2全不为0,两边用f作用,有
λ1e1+⋯+λses=0而λ1,λ2不全为0,与e1,⋯,es中非零向量线性无关矛盾。
命题5.3 f是K上n维线性空间V上的线性变换,λ1,⋯,λs是f的s个全部不同的特征值,则f可对角化的充要条件是各特征值几何重数的和为n
证:
λi(i=1,⋯,s)特征子空间的一组基eij,j=1,⋯,ni,令
i=1∑sj=1∑nikijeij=0与上面的推论,有
j=1∑nikijeij=0,i=1,⋯,s于是kij=0,i=1,⋯,s,j=1,⋯,ni,于是f可对角化
我们已经指出,全部特征值由特征多项式det(A−λIn)=0计算得到。特征根在多项式中的重数称为代数重数。
命题5.4 f是K上n维线性空间V上的线性变换,λ0是f的特征值,则其几何重数不超过其代数重数
证:
设λ0的特征空间的几何重数为r,设其中一组基为e1,⋯,er,将其扩张为V的一组基e1,⋯,en,则f在这组基下的矩阵为
[λ0Ir0AB]于是,由分块矩阵行列式计算性质,f的特征多项式为
(λ0−λ)rdet(B−λIn−r)=0而λ0还可能是det(B−λIn−r)=0的根
这说明了,f可对角化,要满足两点:
(1)f的特征多项式的根都在数域K内
(2)f的所有特征值的代数重数都等于几何重数
同时,每个特征值的特征空间的维度至少为1,因此,就有如下的命题:
命题5.5 f是K上n维线性空间V上的线性变换,如果f有n个不同的特征值,则f可对角化