线性代数应该这样学7:对偶空间、对偶映射,零化子,矩阵的转置

在本系列中,我的个人见解将使用斜体标注。由于时间关系,从本篇文章起,将移除例题选项,可参考答案链接,如有疑问,可在评论区处留言。由于文章是我独自整理的,缺乏审阅,难免出现错误,如有发现欢迎在评论区中指正。

Part 1:对偶空间与对偶映射

请将本篇文章所涉及的内容与之前所学过的基于矩阵的线性代数相结合,否则本章的内容可能看得你头晕目眩。

线性泛函(linear functional) 从\(V\)到\(\mathbb{F}\)的线性映射,即\(\mathcal L(V,\mathbb{F})\)中的元素。

  • 对于\(\mathbb{F}^n\)上的线性泛函,其一般形式为\(\phi(x_1,\cdots,x_n)=\sum_{j=1}^n a_jx_j\)。
  • 对于\(\mathcal P(\mathbb{R})\)上的线性泛函,对多项式使用线性算子后进行取值是线性泛函。
  • 对于\(\mathcal M(T)\)上的线性泛函,其形式为\(\phi(\mathcal M(T))=\sum_{j=1}^m\sum_{k=1}^m w_{mn}a_{mn}\)。

对偶空间(dual space) \(V\)上所有线性泛函构成的向量空间称为\(V\)的对偶空间,即

\[V'=\mathcal L(V,\mathbb{F}). \]

显然,如果\(V\)是有限维的,则\(\dim V=\dim V'\)。

对偶基(dual basis) 设\(v_1,\cdots,v_n\)是\(V\)的基,则这组基的对偶基是\(V'\)中的元素组\(\varphi_1,\cdots,\varphi_n\),这里

\[\varphi_i(v_j)=\delta_{i-j}. \]

首先,要证明\(\varphi_1,\cdots,\varphi_n\)确是\(V'=\mathcal L(V,\mathbb{F})\)中的元素,基于如下定理:若\(v_1,\cdots,v_n\)是\(V\)的基,\(w_1,\cdots,w_n\in W\),则存在唯一的一个线性映射\(T\in\mathcal L(V,W)\)使得对任何\(j=1,\cdots,n\)都有\(T(v_j)=w_j\)。

下证\(\varphi_1,\cdots,\varphi_n\)是\(V'\)的基,要证明张成性与线性无关性。先证明线性无关性,设

\[a_1\varphi_1+\cdots+a_n\varphi_n=0, \]

这里\(0\in V'\)是零映射,则\(\forall j=1,\cdots,n\),有

\[(a_1\varphi_1+\cdots+a_n\varphi_n)(v_j)=a_j=0, \]

这就说明了\(a_1=\cdots=a_n=0\),线性无关性得证。

由于\(\dim V'=\dim V=n\),所以\(\varphi_1,\cdots,\varphi_n\)是长度为\(\dim V'\)的线性无关向量组,自然是\(V'\)的基。

对偶映射(dual map) 若\(T\in\mathcal L(V,W)\),则\(T\)的对偶映射是线性映射\(T'\in\mathcal L(W',V')\),满足\(\forall \varphi\in W'\),有

\[T'(\varphi)=\varphi T. \]

对偶映射是线性映射,是基于以下事实:线性映射的乘积(复合)仍是线性映射;并且对偶映射将一个线性泛函映射到另一个线性泛函,建立起两个线性泛函之间的关系。需要注意,这里的\(T'\)中的\('\)并非对\(T\)求导,实际上\(T\)不是一个函数也不可导

另外,对偶映射将一个线性泛函映射到另一个线性泛函上,在矩阵空间中,\(V'\)中线性泛函可以视为一个\(n\)维行矩阵,\(W'\)中的线性泛函可以视为一个\(m\)维行矩阵,而对偶映射又是线性映射,因此可以用一个\(n\times m\)矩阵表示。实际上,如果将一个行矩阵视为一个向量(本书中向量对应的矩阵都是列矩阵),最自然的方式是什么?自然是将其转置。在这个层面上理解,就可以理解对偶映射实际上与矩阵转置这一概念相对应

注意,对偶映射是线性映射,指的是对于\(\varphi_1,\varphi_2\in W'\),有

\[T'(\varphi_1+\varphi_2)=T'(\varphi_1)+T'(\varphi_2),\\ T'(\lambda \varphi_1)=\lambda T'(\varphi). \]

我们接下来要验证对偶映射\('\)自身具有加性和齐性,是\(\mathcal L(V,W)\)上的线性映射。

  1. \(\forall S,T\in\mathcal L(V,W)\),有\((S+T)'=S'+T'\)。
  2. \(\forall \lambda\in\mathbb{F}\)和\(T\in\mathcal L(V,W)\),有\((\lambda T)'=\lambda T'\)。
  3. \(\forall T\in\mathcal L(U,V)\)和\(S\in\mathcal L(V,W)\),有\((ST)'=T'S'\)。

对于第一条,设\(\varphi\in V'\),则

\[(S+T)'(\varphi)=\varphi(S+T)=\varphi S+\varphi T=S'(\varphi)+T'(\varphi), \]

故\((S+T)'=S'+T'\),同理可验证第二条。

对于第三条,\(\forall \varphi\in W'\),有

\[(ST)'(\varphi)=\varphi ST=S'(\varphi)T, \]

这里\(S'(\varphi)\in V'\),故

\[(ST)'(\varphi)=S'(\varphi)T=T'S'(\varphi), \]

所以\((ST)'=T'S'\)。

如果用矩阵转置的观点看待对偶映射,这三点都是显然的

Part 2:对偶映射的零空间与值域

从矩阵转置的角度来看,\(T'\)的零空间可以如此推导:

\[Tv=0,\quad v'T'=0. \]

这里\(v'\)是\(v\)作为列向量的转置,成为一个\(n\)维行向量,从前面的推导来看,\(n\)维行向量\(v'\)就是\(V\)中的线性泛函。如果\(v\in\mathrm{null}T\),那么\(v'\)所代表的向量处于什么样的线性空间?这就要引入零化子的定义

零化子(annihilator) 对于\(U\subset V\),\(U\)的零化子\(U^0\)是\(V'\)的子集,定义为

\[U^0=\{\varphi\in V':\forall u\in U,\varphi(u)=0 \}. \]

从定义上来看,零化子有点难以理解。首先,零化子是线性泛函构成的集合;其次,零化子依赖于某个\(V\)的子空间,并将子空间上的元素全部经线性泛函映射到\(0\in\mathbb{F}\)

零化子是子空间 设\(U\in V\),则\(U^0\)是\(V'\)的子空间。显然子空间是比子集更强的条件。

显然,\(0\in U^0\),这里\(0\)是\(V'\)中的线性泛函。

设\(\varphi_1,\varphi_2\in U^0\),则\(\forall u\in U\),

\[(\varphi_1+\varphi_2)(u)=\varphi_1(u)+\varphi_2(u)=0, \]

所以\(\varphi_1+\varphi_2\in U^0\),同理有\(\lambda \varphi_1 \in U^0\),

零化子的维数 设\(V\)是有限维的,\(U\)是\(V\)的子空间,则

\[\dim U+\dim U^0=\dim V. \]

证明有关维数的结论,总可以用基扩充的方式,此处的维数公式也不例外

设\(\dim U=m<n=\dim V\),\(v_1,\cdots,v_m\)是\(U\)的基,扩充为\(V\)的基是\(v_1,\cdots,v_n\)。要证明\(\dim U^0=n-m\),只需证明\(U^0\)中包含的一组基是\(\varphi_{m+1},\cdots,\varphi_n\),这里

\[\varphi_j(v_k)=\delta_{j-k}. \]

这个\(n-m\)维向量组的线性无关性由对偶基的定义保证,下证其张成性。\(\forall \varphi\in U^0\)和\(u\in U\),由于\(\varphi\in V'\),故有

\[\varphi=b_1\varphi_1+\cdots+b_n\varphi_n, \\ u=a_1v_1+\cdots+a_mv_m, \]

所以

\[\varphi(u)=a_1b_1+\cdots+a_mb_m=0. \]

分别取\((a_1,\cdots,a_m)=(1,0,\cdots,0)\)、\((0,1,\cdots,0)\)等就可以证明\(b_1=\cdots=b_m=0\),于是

\[\varphi=b_{m+1}\varphi_{m+1}+\cdots+b_n\varphi_n, \]

所以\(\varphi_{m+1},\cdots,\varphi_n\)张成\(U^0\),即证

\[\dim U^0=n-m=\dim V-\dim U. \]

书中提供了一种更简洁的证明,关键在于构造一个示性映射,并运用线性映射基本定理得到此等式

设\(i\in\mathcal L(U,V)\),定义为\(\forall u\in U\),\(i(u)=u\);\(\forall w\in V\setminus U\),\(i(w)=0\)。则\(i'\in\mathcal L(V',U')\),对\(i'\)运用线性映射基本定理,有

\[\dim V'=\dim \mathrm{null}i'+\dim\mathrm{range}i'. \]

由定义得\(\mathrm{null}i'=U^0\)。若\(\varphi\in V'\),\(\forall v=u+w\)这里\(u\in U,w\in V\setminus U\),则\(i'(\varphi)(v)=\varphi(i(v))=\varphi(u)\),可以定义\(\psi\in U'\)使得\(\varphi(v)=\varphi(u)=\psi(u)\),这就说明\(\mathrm{range}i'=U'\),综上得到

\[\dim V'=\dim U^0+\dim U',\\ \dim U^0+\dim U=\dim V. \]

\(T'\)的零空间 设\(V,W\)都是有限维的,\(T\in\mathcal L(V,W)\),则

  1. \(\mathrm{null}T'=(\mathrm{range}T)^0\);
  2. \(\dim\mathrm{null}T'=\dim\mathrm{null}T+\dim W-\dim V\)。

证明第一条。设\(\varphi\in \mathrm{null}T'\),则\(\forall v\in V\),有

\[T'(\varphi)(v)=\varphi(Tv)=0, \]

即\(Tv\in \mathrm{range}T\),\(\varphi(Tv)=0\),故\(\varphi\subset (\mathrm{range}T)^0\)。

设\(\varphi\in(\mathrm{range}T)^0\),则\(\forall v\in V\),\(Tv\in\mathrm{range}T\),故

\[T'(\varphi)(v)=\varphi(Tv)=0, \]

所以\(\varphi\in\mathrm{null}T'\)。综上,

\[\mathrm{null}T'=(\mathrm{range}T)^0. \]

对第二条的证明,只需套用维数公式即可。

\(T\)是满射等价于\(T'\)是单射 设\(V,W\)都是有限维向量空间,\(T\in\mathcal L(V,W)\),则\(T\)是满射当且仅当\(T'\)是单射。

由于\((\mathrm{range}T)^0\subset W\),所以

\[\dim \mathrm{null}T'=\dim(\mathrm{range}T)^0=\dim W-\dim\mathrm{range}T \]

若\(T\)是满射,则\(\dim W=\dim\mathrm{range}T\),所以\(\dim\mathrm{null}T'=0\),即\(T'\)是单射。

若\(T'\)是单射,则\(\dim W=\dim\mathrm{range}T\),即\(T\)是满射。

\(T'\)的值域 设\(V,W\)都是有限维的,\(T\in\mathcal L(V,W)\),则

  1. \(\dim\mathrm{range}T'=\dim\mathrm{range}T\);
  2. \(\mathrm{range}T'=(\mathrm{null}T)^0\)。

证明第一条,由于\(T'\in\mathcal L(W',V')\),所以

\[\dim\mathrm{range}T'=\dim W'-\dim \mathrm{null}T', \]

又\(\dim W'=\dim W\),\(\dim \mathrm{null}T'=\dim\mathrm{null}T+\dim W-\dim V\),所以

\[\dim\mathrm{range}T'=\dim V-\dim\mathrm{null}T=\dim \mathrm{range}T. \]

证明第二条,对\(\forall \varphi\in\mathrm{range}T'\),则存在\(\psi\in W'\),使得

\[\varphi=T'(\psi)=\psi T, \]

故\(\forall v\in\mathrm{null}T\),有

\[\varphi(v)=\psi (Tv)=0, \]

即\(\varphi\in(\mathrm{null}T)^0\),\(\mathrm{range}T'\subset (\mathrm{null}T)^0\)。现证明两个子空间有相同的维数:

\[\dim\mathrm{range}T'=\dim\mathrm{range}T=\dim V-\dim \mathrm{null}T=\dim(\mathrm{null}T)^0, \]

这就证明了\(\mathrm{range}T'=(\mathrm{null}T)^0\)。

这个证明为我们提供了一个新的证明两个子空间相等的思路:如果有一侧包含不易证明,则证明两个子空间有相同的维数,这样只需要证明单边的包含即可

Part 3:转置矩阵

转置(transpose) 矩阵\(A\)的转置(记作\(A^\intercal\))是通过互换\(A\)的行和列获得的矩阵,即

\[(A^\intercal)_{k,j}=A_{j,k}. \]

显然,转置作为线性映射,具有加性和齐性。接下来证明矩阵乘积的转置,这是一个我们所熟知的结论,但为了文章的完整性,将结论附在此处。

矩阵乘积的转置 设\(A_{m\times n}\),\(C_{n\times p}\),则

\[(AC)^\intercal=C^\intercal A^\intercal. \]

设\(1\le k\le p\),\(1\le j\le m\),则

\[\begin{aligned} ((AC)^\intercal)_{k,j}&=(AC)_{j,k}\\ &=\sum_{r=1}^{n}A_{j,r}C_{r,k}\\ &=\sum_{r=1}^n(C^\intercal)_{k,r}(A^\intercal )_{r,j}\\ &=(C^\intercal A^\intercal)_{k,j}. \end{aligned} \]

这代表\((AC)^\intercal=C^\intercal A^\intercal\)。

接下来要正式引入矩阵转置与对偶映射之间的关系,首先要定义基,这里都取\(v_1,\cdots,v_n\)、\(w_1,\cdots,w_m\)以及它们的对偶基\(\varphi_1,\cdots,\varphi_n\)、\(\psi_1,\cdots,\psi_m\)计算。

\(T'\)的矩阵 设\(T\in\mathcal L(V,W)\),则

\[\mathcal M(T')=(\mathcal M(T))^\intercal. \]

设\(A=\mathcal M(T)\),\(C=\mathcal M(T')\),设\(1\le j\le m\),\(1\le k\le n\)。

由\(\mathcal M(T')\)的定义,有

\[\psi_jT=T'(\psi_j)=\sum_{r=1}^nC_{r,j}\varphi_r, \]

故两端同时映射\(v_k\),有

\[\psi_jTv_k=\sum_{r=1}^n C_{r,j}\varphi_r(v_k)=C_{k,j}, \]

另一边,由于

\[Tv_k=\sum_{r=1}^mA_{r,k}w_r, \]

所以

\[\psi_jTv_k=\sum_{r=1}^mA_{r,k}\psi_j(w_r)=A_{j,k}. \]

故\(A_{j,k}=C_{k,j}\),这就证明了结论。

行秩(row rank)与列秩(column rank) 设\(A_{m\times n}\),则\(A\)的行秩是\(A\)的各行在\(\mathbb{F}^{1,n}\)中张成空间的维数,\(A\)的列秩是\(A\)的各列在\(\mathbb{F}^{m,1}\)中张成空间的维数。

  • 行秩与列秩的定义在之前的学习中早就了解了,这里不作过多的展开。
  • 显然,\(\mathrm{range}T\)的维数就是\((Tv_1,\cdots,Tv_n)\)的维数,故为\(\mathcal M(T)\)的列秩。
  • 由于\(\mathcal M(T')\)是\(\mathcal M(T)\)的转置,且\(\dim\mathrm{range}T=\dim\mathrm{range}T'\),所以从这个角度,也获得了行秩等于列秩的结论。

矩阵的秩(rank) 矩阵\(A\in\mathbb{F}^{m,n}\)的秩定义为\(A\)的列秩,也等于其行秩。

上一篇:[文献记录]A Lexicon-Based Graph Neural Network for Chinese NER 基于词汇的中文NER图神经网络


下一篇:task4