这是一个新系列,是《线性代数应该这样学》的学习笔记。《线性代数应该这样学》这本书着眼于向量空间、线性映射而不是欧式空间和行列式,因此能提供一种学习线性代数的新视野。
在本系列中,我的个人见解将使用斜体标注。每篇文章的最后,我将选择摘录一些例题。
Part 1:数域
这里主要强调复数,记虚数单位为\(\mathrm{i}\),复数的正式定义如下。
复数(complex number) 一个复数是一个有序对\((a,b)\),其中\(a,b\in\mathbb{R}\),将此复数写成\(a+b\mathrm{i}\)。所有复数的集合记为
\[\mathbb{C}=\{a+b\mathrm{i}: a,b\in\mathbb{R} \}. \]定义\(\mathbb{C}\)上的加法和乘法为:
\[(a+b\mathrm{i})\oplus(c+d\mathrm{i})=(a+c)+(b+d)\mathrm{i},\\ (a+b\mathrm{i})(c+d\mathrm{i})=(ac-bd)+(ad+bc)\mathrm{i}. \]这里\(a,b,c,d\in\mathbb{R}\)。
这里我选择了和书上不一样的加法写法,这是因为我把一般的加法\(+\)视为复数结构的一部分,因此为了表达两个元素之间的加法就引入了\(\oplus\),也许这样能让读者对复数空间有更好的理解。
基于这种定义,一般的实数可以写成\(a+0\mathrm{i}\xlongequal{def}a\),一般的虚数可以写成\(0+b\mathrm{i}\xlongequal{def}b\mathrm{i}\)。书上提到自行验证\(\mathrm{i}^2=-1\),这意味着虚数单位的定义并非来源于通常所理解的\(\sqrt{-1}\),而是其运算定义导致了\(\mathrm{i}^2=-1\)。
\[\mathrm{i}^2=(0+1\mathrm{i})(0+1\mathrm{i})=(0^2-1^2)+(0\times 1+1\times 0)\mathrm{i}=-1. \]
接下来给出了复数的六条运算性质:
- 交换性(commutativity):\(\forall\alpha,\beta\in \mathbb{C}\),有\(\alpha\oplus\beta=\beta\oplus\alpha\),\(\alpha\beta=\beta\alpha\)。
- 结合性(associativity):\(\forall \alpha,\beta,\lambda\in \mathbb{C}\),有\((\alpha\oplus\beta)\oplus \lambda=\alpha\oplus(\beta\oplus\lambda)\),\((\alpha\beta)\lambda=\alpha(\beta\lambda)\)。
- 单位元(identities):\(\forall\lambda\in\mathbb{C}\),有\(\lambda\oplus0=\lambda\),\(\lambda 1=\lambda\)。
- 加法逆元(additive inverse):\(\forall \alpha\in\mathbb{C}\),\(\exists!\beta\in\mathbb{C}\),\(\alpha\oplus\beta=0\)。
- 乘法逆元(multiplicative inverse):\(\forall \alpha\in\mathbb{C},\alpha\ne 0\),\(\exists!\beta\in\mathbb{C}\),\(\alpha\beta=1\)。
- 分配性质(distributive property):\(\forall \lambda,\alpha,\beta\in\mathbb{C}\),\(\lambda(\alpha\oplus\beta)=\lambda\alpha\oplus\lambda\beta\)。
这六条性质的证明,1、2、3、6都可以利用复数的结构与运算律直接证明,即将\(\alpha\)写成\(a+b\mathrm{i}\),将\(\beta\)写成\(c+d\mathrm{i}\)。4、5证明有关唯一性,证明其唯一性只要说明其构造方式是唯一的即可。
令\(\alpha=a+b\mathrm{i}\),如果\(\alpha\oplus\beta=0\),设\(\beta=c+d\mathrm{i}\),则有
\[\left\{ \begin{array}l a+c=0,\\ b+d=0. \end{array}\right.\Rightarrow \left\{ \begin{array}l c=-a,\\ d=-b. \end{array}\right. \]得\(\beta=-a-b\mathrm{i}\)。
\(\alpha\ne 0\)即\(a^2+b^2\ne 0\),如果\(\alpha\beta=1\),则
\[\left\{\begin{array}l ac-bd=1,\\ bc+ad=0 \end{array}\right.\Rightarrow\left\{\begin{array}l c=\frac{a}{a^2+b^2},\\ d=\frac{-b}{a^2+b^2}. \end{array}\right. \]得
\[\beta=\frac{a}{a^2+b^2}-\frac{b}{a^2+b^2}\mathrm{i}. \]
既然证明了加法逆元和乘法逆元的唯一性,就可以定义加法逆元\(-\alpha\)和乘法逆元\(1/\alpha\)了,在此基础上,定义复数的减法(subtraction)和除法(division)。
减法 \(\mathbb{C}\)上的减法定义为\(\beta\ominus\alpha=\beta\oplus(-\alpha)\)。
除法 \(\mathbb{C}\)上的除法定义为\(\beta/\alpha=\beta(1/\alpha)\)。
从减法的定义上,也可以看到负号既可作为复数的结构,也可作为两个复数之间的运算符,使用\(-\)和\(\ominus\)将这两种作用完全区分开。
\(\mathbb{C}\)和\(\mathbb{R}\)都属于数域,在接下来的内容中,数域以\(\mathbb{F}\)表示,从而我们也不用\(\oplus\)来给两个数域中的元素相加了,因为数域中的元素被我们统称为标量(scalar)。
Part 2:组与长度
组(list) 设\(n\)为非负整数,长度(length)为\(n\)的组是\(n\)个有顺序的元素,具有如下形式:
\[(x_1,\cdots,x_n). \]\(\mathbb{F}^n\) \(\mathbb{F}\)中元素组成的,长度为\(n\)的组的集合:
\[\mathbb{F}^n=\{(x_1,\cdots,x_n):x_j\in\mathbb{F},j=1,\cdots,n \}. \]坐标(coordinate) 称\(x_j\)是\((x_1,\cdots,x_n)\)的第\(j\)个坐标。
可以看到,组一定是有限长度的,无限长度的序列不是组。从这里开始,就引入了向量与标量的区别。为了使\(\mathbb{F}^n\)有意义,必须在这个空间上定义运算。
我们将\(\mathbb{F}^n\)中的\(n\)元组称为\(\mathbb{F}^n\)中的点或向量。
相等 \(\mathbb{F}^n\)中的两个向量相等,当且仅当它们对应位置的元素相等。
加法 \(\mathbb{F}^n\)中的两个向量相加,等价于将其对应位置的元素对应相加。
零 \(\mathbb{F}^n\)中的加法单位元记作\(0\),满足\(\forall x\in\mathbb{F}^n\),\(x+0=x\)。
加法逆元 \(\mathbb{F}^n\)中向量\(x\)的加法逆元是满足\(x+(-x)=0\)的向量\((-x)\),它是唯一的。
标量乘法(scalar multiplication) 如果\(\lambda\in\mathbb{F}\)且\(x\in\mathbb{F}^n\),则定义标量乘法为
\[\lambda x=\lambda(x_1,\cdots,x_n)=(\lambda x_1,\cdots,\lambda x_n). \]Part 3:向量空间
向量空间 向量空间是带有加法和标量乘法的集合\(V\),满足如下性质:
- 交换性:\(\forall u,v\in V\),有\(u+v=v+u\)。
- 结合性:\(\forall u,v,w\in V\)和\(a,b\in \mathbb{F}\),有\((u+v)+w=u+(v+w)\)和\((ab)v=a(bv)\)。
- 加法单位元:\(\exists 0\in V\),\(\forall v\in V\),有\(v+0=v\)。
- 加法逆元:\(\forall v\in V\),\(\exists w\in V\),\(v+w=0\)。
- 乘法单位元:\(\forall v\in V\),有\(1v=v\)。
- 分配性质:\(\forall a,b\in \mathbb{F}\)和\(u,v\in V\),有\(a(u+v)=au+av\)和\((a+b)v=av+bv\)。
如果给定一个空间要验证其是否是向量空间,前五条性质一般比较容易满足,而分配性质在与交换性、结合性配合时可能会出问题。
需要注意,加法单位元和加法逆元在定义上并没有表明是唯一的。这似乎与我们的通常理解相违背,然而其唯一性没有出现在定义上,仅仅是因为它可以根据其他的性质推断得出。
如果\(0\)和\(0'\)是加法单位元,则
\[0=0+0'=0'+0=0'. \]如果\(w\)和\(w'\)都是\(x\)的加法逆元,则
\[w=w+(x+w')=(w+x)+w'=0+w'=w'. \]这就证明了加法逆元的唯一性。
由于加法逆元唯一的,\(v\)的加法逆元就可以定义为\((-v)\),然后顺理成章地定义减法为
\[w-v=w+(-v). \]加法逆元和加法单位元都可以通过数乘来寻找,书上的定理指出了数\(0\)乘以任何向量得到的都是加法单位元\(0\);数\(-1\)乘以任何向量\(v\)得到的都是\(v\)的加法逆元\((-v)\)。
另外需要注意的就是,向量空间的定义还依赖于标量乘法中,标量的取值域。一般的要求是标量必须在某个数域内取值,然而\(\mathbb{R}\)和\(\mathbb{C}\)的作用范围可能还不太一致。比如\(\mathbb{R}^n\)关于\(\mathbb{R}\)是向量空间,但关于\(\mathbb{C}\)不是,这是因为只要在非实数内取标量,则加法将不在\(\mathbb{R}^n\)上封闭。
在上一Part中提到的\(\mathbb{F}^n\)其实只是向量空间的一种,要描述一个向量空间,需要注意以下几点:向量如何定义,标量在哪里取值,加法如何定义,标量乘法如何定义。书上还提供了以下几种向量空间:
- \(\mathbb{F}^{\infty}\):\(\mathbb{F}\)中所有元素的无穷序列构成的集合,标量在\(\mathbb{F}\)上取值,具有通常意义上的加法和乘法。
- \(\mathbb{F}^S\):这里\(S\)是一个数集,\(\mathbb{F}^{S}\)是\(S\)到\(\mathbb{F}\)的所有函数\(f\)构成的集合,标量在\(\mathbb{F}\)上取值,加法\(f+g\)定义为\(\forall x\in S,(f+g)(x)=f(x)+g(x)\);数乘\(\lambda f\)定义为\(\forall x\in S,(\lambda f)(x)=\lambda(f(x))\)。
例题
关于本章的例题,我觉得更多是一种证明思想上的理解。
第一题(1.B 3) 设\(v,w\in V\),说明为什么有唯一的\(x\in V\),使得\(v+3x=w\)。
为了证明唯一性,一般可举出两个满足要求的例子,再通过一定的条件证明这两个例子相等。
设\(x,y\)都满足\(v+3x=w=v+3y\),则
\[x=\frac{1}{3}(w-v)=\frac{1}{3}(v+3y-v)=\frac{1}{3}(3y)=y. \]
第二题(1.B 5) 证明在向量空间的定义中,关于加法逆元的那个条件可替换为
\[\forall v\in V,0v=0. \]证明两个条件可相互替换,就是在其他条件的帮助下这两个条件等价,这当然包括充分性与必要性。
如果\(\forall v\in V,0v=0\),则
\[0v=(1+(-1))v=1v+(-1)v=v+(-1)v=0, \]这就证明了\((-1)v\)是\(v\)的加法逆元。
如果每一个数都有唯一的加法逆元,则\(\forall v\),
\[0v=(0+0)v=0v+0v, \]两边同时加上\(0v\)的加法逆元,就得到\(0v=0\)。
这里要注意,不能用\(0v=(1-1)v=v-v=0\)来做,这是因为我们还没有证明\((-1)v\)一定是\(v\)的加法逆元。
第三题(1.B 6) 设\({\infty}\)和\({-\infty}\)是两个不同的对象,它们都不属于\(\mathbb{R}\)。现在欲在\(\mathbb{R}\cup\{\infty\}\cup\{-\infty\}\)上定义加法和标量乘法。两个实数的加法和标量乘法按实数的运算法则定义,并且对\(t\in\mathbb{R}\)定义
\[t\infty=\left\{\begin{array}l -\infty,& t<0;\\ 0,& t=0;\\ \infty,& t>0. \end{array}\right.\quad t(-\infty)=\left\{\begin{array}l \infty,& t<0;\\ 0,& t=0;\\ -\infty,& t>0. \end{array}\right.\\ t+\infty=\infty+t=\infty,\quad t+(-\infty)=(-\infty)+t=-\infty,\\ \infty+\infty=\infty,\quad (-\infty)+(-\infty)=-\infty,\quad \infty+(-\infty)=0. \]问\(\mathbb{R}\cup\{\infty\}\cup\{-\infty\}\)是否是\(\mathbb{R}\)上的向量空间?说明理由。
理解这个题,关键是得知道题目在说什么。令\(V=\mathbb{R}\cup\{\infty\}\cup\{-\infty\}\),要验证\(V(\mathbb{R})\)是不是一个向量空间。显然它不是,不然数学家早就这么定义了,关键在于如何证伪。分配性质是其最容易不满足的性质。
在向量空间必须满足的性质下,由于
\[\infty=1\infty=(2+(-1))\infty=2\infty+(-1)\infty=\infty+(-\infty)=0, \]从而\(\infty\)也是加法单位元,有\(v+\infty=v\),这与\(v+\infty=\infty\)矛盾,因此不是向量空间。