Single linked list by pointer

 

其实本应该从一般性的表讲起的,先说顺序表,再说链表 。但顺序表的应用范围不是很广,而且说白了就是数组的高级版本,他的优势仅在于两点:1.逻辑直观,易于理解。2.查找某个元素只需要常数时间——O(1),而与此同时,因为每个单元的物理内存都是连续的,所以不便于移动,不便于精细化操作,每次插入和删除都会带来巨额的时间开销。什么叫巨额时间开销  举个栗子:我要在开头加一个数进去,那我要把所有的元素都往后移一位,空出来一个位置,这就需要穿过整个表,假如这个表有1000万个元素,大家可以自己脑补一下要花多久,答案是O(n)。这是时间的浪费。而如果用来计算稀疏多项式,比如:x^100+x^1300+x,这会造成中间有很多存储单元里存的是0,没有任何意义,但却实实在在消耗了内存,这是空间浪费。

 

因为插入和删除的运行时间非常慢,而且表的大小还必须事先已知,所以一般不用简单数组来实现表这种结构。

 

Single linked list by pointer

 

 

 

现在我们需要一种灵活的方法来使我们突破连续储存带来的限制,那怎么办呢?就不连续储存呗,把空间离散化。每一个单元里面大体分为两部分,一边存数据,另一边存下一个单元的地址,这样一来,逻辑上仍然是连续的,而在物理内存中则是星罗棋布了。这就是我们要学的链表了。这是我们要学的第一种线性结构。

 

 

现在,我们要加入或者移除一个元素的时候,就不必担心会对全体数据造成影响了,只需要改动“链条”就好了,其他不变。这样就能减少增删的时间开销了。单链表的样子就像这样:

Single linked list by pointer

 

可以脑补一列火车车厢hhhhhh  

Single linked list by pointer

 

当然火车车厢是双链表,我们现在简便起见,先介绍单链表。

 

 删除的命令可以通过修改一个指针来实现,就像这样:

 

Single linked list by pointer 

 

插入的话,我们需要申请一个新单元,怎么申请?printf("请给我一点内存,谢谢");

显然不是的,对吧。那该怎么做?

 

Single linked list by pointer

 

对!malloc函数,说到这个,我多说几句啊。首先,别拼错了,我之前会手滑打错,也遇到过记不住这个函数名字的小白,咱得记住它的意思“Memory Allocate“,内存分配,这个内存从哪分配的呢,总不会是操作系统凭空变出来的,它是从“堆(Heap)”上分配来的,这个堆也是我们以后要学的一种数据结构。

 

 

 接着说插入,申请一个新单元之后,我们再做两次指针调整就好了,就像这样:

 

Single linked list by pointer

 

 

重点:整个链表的核心在于指针的调整,而首先,我们要“拉住”整个链表,也就是说我们需要一个引子,来牵住整个一长串的表,这个引子就相当于火车头。因为每一个单元的物理位置都是随机的,想找到下一个只能依靠前一个单元的尾针(毕竟这是单链表)。

 

Single linked list by pointer操作指针时一定要小心,包括调整顺序和指向。否则就会像这样

Single linked list by pointer

 

 

我们的目标是成为老司机,不要翻车。

 

 

好了,大概的思路我们已经捋顺了,现在来说具体怎么做。

 

前面提到了,我们需要一个引子,具体做法是留出一个标志节点,习惯称为表头(header)。说是节点,其实仅仅是一个指针,没有存放数据的位置。像这样

 

 

这里注意一点:表头后的一个单元,叫做头节点,这个节点有数据域,但是也不存有效数据,它仅仅是证明表的存在性。(我初学的时候因为这点没搞透彻,导致代码运行时各种bug,大家要引以为戒啊……)

 

接下来是代码实现,首先约定一些名字

 

 1  
 2 struct Node;                //先声明一个节点,后面定义
 3 typedef struct Node *PtrToNode;     /*声明节点指针,并且将其类型替换为PtrToNode(替换之前是struct Node*),这样做的目的是方便我们理解*/
 4  
 5  
 6 typedef PtrToNode List; //将struct Node*再次替换为List(表),进一步直观化
 7 typedef PtrToNode Position;//将struct Node*再次替换为Position(位置)
 8  
 9 struct Node{
10     int data;
11     Position Next;
12 };

 

这里的List和Position有什么区别呢?可能很多人会有这个疑问,区别在于,List指表头,Position指某个单元,在后面代码中我们会有更清晰的认识,走吧,咱们继续。

 

现在我们来一一讨论针对链表的各个操作函数。这里多说一句,关于函数返回值的问题:因为C语言没有bool类型,也就是TRUE和FALSE,所以它用1表示真,0表示假。

(你们不要嫌我啰嗦……)

 

 

首先,判断某个表是否为空

 

1  
2 /*如果某个表为空,返回1*/
3 int IsEmpty(List L){
4     return L->Next==NULL;//在最后一个单元里,后面是封口的,也就是指针域是NULL
5 }

 

我们还需要判断某个表是不是在末尾,这是为了作为循环的终止条件。写法上和判空没什么区别,只是分开写会更方便理解,在完整的代码里我们会感受到的,拭目以待吧。

1  
2 /*如果P是在表中的末尾位置,返回1*/
3 int IsLast(Position P) {
4     return P->Next==NULL;
5 }

 

这些小零碎写完之后,我们就需要把大的零件写出来了(看吧,在咱们这个领域,要搞一件工程,无论说创造零件还是拼装零件,只需要智力加持,代码就会从手中滑落而出,是不是很优雅2333)

 

对于大部分线性结构,我们要做的操作大体上分为:增加,删除,查找,遍历这四种,我们先写查找,因为这是删除的基础。为什么删除之前要先查找呢?两个原因,1.我们一般是告诉系统要删除的某个“数据”,也就是节点里data的值,所以要先找到这个值所在的节点是哪个,2.因为这是单链表,如果不拿到要删除元素的前驱,我们可能会丢失整个表。

 

删除有一个很重要的步骤是释放内存,用free函数,我们刚开始学可能会想当然,觉得直接找到那个元素,然后free一下就好了,那就会造成后面的表全部丢失,这是灾难性的后果。

Single linked list by pointer

 

想一想,假如我们直接free(Temp),A将指向一个未知的地方,后面的所有元素就丢失掉了。

所以来写一个查找前驱的函数,它返回一个前驱,假如我们给一个3,他就返回3前面那个表的位置,上面说的原因2决定了写这个函数的必要性,而原因1决定了这个函数还需要一个int型参数。

 

1  
2 Position FindPrevious(int X,List L){
3     Position P;                 //声明一个节点指针,并指向头节点(和表头一样)
4          P=L;
5 /* 2*/while (P!=NULL && P->Next->data!=X) { //P没有走到末尾,同时还没找到给定的X时
6         P=P->Next;                  //P向后走
7       }           //走到这一步时,说明要么没找到,P=NULL(结尾处),要么找到了,P=前驱的位置
8     return P;
9 }

 

 

第二行用到“与(&&)”操作走了捷径,也就是说,如果“与”运算前半部分为假,结果就自动为假,后半部分不再执行,也就是短路操作,咱们上学期讲过。

 

 

按逻辑来说,应该紧接着写删除函数的,正好和FindPrevious相配。但是我想强调一个重要的点,一会再说删除,先说查找函数,这个和上面的区别是:这个返回”当前位置“,上面那个返回”前一个位置“。

1 Position Find(int X,List L) {
2     Position P;
3     P=L->Next;      //和上面对比一下,区别在哪?
4     while (P!=NULL && X!=P->data) {
5         P=P->Next;
6     }
7     return P;
8 }

 

这个大体思路和上面一样,但有一个要点,这个函数的起始位置在第一个有效元素,比查找前驱的函数靠后一位,原因好理解吧,这个要查找当前位置,而不是前一个,所以从L->Next开始。

 

 

好了,我们该说删除操作了

 

 1 void Delete(int X,List L) {
 2     Position P,Temp;        //申请两个节点,一个用作拉住前驱,一个用作临时变量
 3     P=FindPrevious(X, L);   //用P拉住X的前驱
 4     if (!IsLast(P)) {       //确定P不是末尾,否则没法删除(末尾后面什么也没有)
 5     Temp=P->Next;       //用临时指针拉住当前位置,以便后面直接越过这个节点
 6     P->Next=Temp->Next; //当前节点的前驱直接指向后继,绕过了当前节点
 7     free(Temp);         //释放当前节点内存
 8     Temp->Next=NULL;    //将当前节点的指针“收回来”,脑补一下飞机起落架。
 9     }
10 }

 

这里面有两个我想说的地方

  • 9,11行用了一个临时指针,是为了怕大家绕晕,其实也可以写成P->Next=P->Next->Next; 不过这样一来就不好理解了,肯定一堆人默默吐槽两个Next是什么鬼啊。
  • 第15行貌似教材里没有,但这是为了防止出现野指针。

 

 

下面我们说插入函数,分为从前插入和从后插入,emmmm好污的感觉(捂脸),向前插入的一个特点是,表头位置不变,而向后插入需要不断更新Position。

 

先说从前插入,分为三步:

  1. 打开冰箱
  2. 把大象放进去
  3. 关上冰箱  

(划掉)

 

其实是:

  1. 分配内存
  2. 向后链接
  3. 向前链接

 

 

1  
2 void InsertBefore(int X,Position P){
3     Position NewNode;            //用一个临时变量,用以“拴住”新单元
4     NewNode=(List)malloc(sizeof(struct Node));  //申请内存,List相当于struct Node*
5     NewNode->data=X;              //将数据填入新单元
6     NewNode->Next=P->Next;        //与后方单元相连
7     P->Next=NewNode;              //与前方单元相连,这两行顺序不能反,原因…你们试试就知道了
8 }

 

 是这个样子

Single linked list by pointer

 

 

这种情况数组的元素是逆序的。

 

再说向后插入

 

1 void PushBack(int X,Position P) {
2     Position NewNode;       //声明一个新的节点指针
3     NewNode=(Position)malloc(sizeof(struct Node));//分配内存
4     NewNode->Next=NULL;     //新节点指针域封闭
5     NewNode->data=X;        //数据装填
6     while(!IsLast(P))       //通过循环走到整个链表的末尾
7         P=P->Next;
8     P->Next=NewNode;        //将新节点的地址交给原链表末尾,从尾部链接。
9 }

 

 

这个更容易理解。

 

再写一个遍历函数,用于打印所有的元素

 

1 void Traverse(List L){
2     while (L->Next!=NULL) {
3         printf("%d ",L->Next->data);
4         L=L->Next;
5     }
6     printf("\n");
7 }

 

下面是用于演示的主程序,根据自己的需要随意往里面增减部件吧

 

 1 int main(){
 2     int i;
 3     List L=(List)malloc(sizeof(struct Node));
 4     L->Next=NULL;
 5     printf("Input amount of lists\n");
 6     scanf("%d",&i);
 7     
 8     while (i--) {
 9         int n;
10         scanf("%d",&n);
11         PushBack(n, L);
12     }
13     Traverse(L);
14     printf("Which item would you like to remove?\n");
15     scanf("%d",&i);
16     Delete(i, L);
17     printf("\n");
18     printf("The current linked lists are : ");
19     Traverse(L);
20 }

 

 

 

其实每个程序员都是魔法师,程序和算法就是现代的魔法,努力修炼自己的法术吧。

 

下一篇写游标实现。

 

p.s.为了方便大家理解,我会在每一行代码后面写注释

pp.s 数据结构是不依赖于具体实现的,所以教科书里用一般性的ElemType表示数据类型,我这里简单起见,全部用int表示

 

上一篇:BST性能分析&改进思路——平衡与等价


下一篇:二叉树及其实现(基础版)