基础概念
数据结构:是相互之间存在一种或多种关系的数据元素的集合。
逻辑结构和物理结构
关于数据结构,我们可以从逻辑结构和物理结构这两个维度去描述
逻辑结构是数据对象中数据元素之间的关系,是从逻辑意义上去描述的数据之间的组织形式。
逻辑结构有4种:
- 集合结构(数据元素之间仅以集合的方式体现,元素之间没有别的关系)
- 线性结构(数据元素之间存在一对一的关系)
- 树(数据元素之间为一对多或多对一的关系)
- 图(数据元素之间为多对多的关系)
物理结构则是逻辑结构在计算机中内存中的存储形式,分为两种:
- 顺序存储结构
- 链式存储结构
线性表(list)
线性表是零个或多个数据元素的的有限序列
线性表是线性结构,元素之间存在一对一的关系,线性表可通过顺序和链式两种方式来实现。
顺序存储结构,是用一段地址连续的存储单元依次存储线性表的数据元素
链式存储结构,用一组任意的存储单元来存储数据元素,不要求物理存储单元的连续性,由一系列结点组成,每个结点除了要存储数据外,还需存储指向后继结点或前驱结点的存储地址。
顺序存储和链式存储对比
-
顺序存储结构
-
优点
- 实现比较简单
- 查找指定位置的元素效率很快,时间复杂度为常数阶O(1)
- 无需额外存储元素之间的逻辑关系(链式存储由于存储空间随机分配,需要存储元素之间的逻辑关系)
-
缺点
- 需要预先分配存储空间,如果数据元素数量变化较大,很难确定存储容量,并导致空间浪费
- 若频繁进行插入删除操作,则可能需要频繁移动大量数据元素
-
优点
-
链式存储结构
-
优点
- 不需要提前分配存储空间,元素个数不受限制
- 对于插入删除操作,在已找到目标位置前提下,效率很高,仅需处理元素之间的引用关系,时间复杂度为O(1)
-
缺点
- 实现相对复杂
- 查找效率较低,最坏情况下需要遍历整张表
- 由于物理存储位置不固定,需要额外存储数据元素之间的逻辑关系
-
优点
链式存储代码实现
单链表
package listdemo;
/**
* Created by chengxiao on 2016/10/18.
*/
public class MyLinkedList {
/**
* 指向头结点的引用
*/
private Node first ;
/**
* 线性表大小
*/
private int size;
/**
* 结点类
*/
private static class Node{
//数据域
private int data;
//指向后继结点的引用
private Node next;
Node(int data){
this.data = data;
}
}
/**
* 从头部进行插入
* 步骤:1.新结点的next链指向当前头结点;2.将first指向新节点
* 时间复杂度:O(1)
* @param data
*/
public void insertFirst(int data){
Node newNode = new Node(data);
newNode.next = first;
first = newNode;
size++;
}
/**
* 从头部进行删除操作
* 步骤:1.将头结点的next链置空 2.将first引用指向第二个结点
* 时间复杂度为:O(1)
* @return
*/
public boolean deleteFirst(){
if(isEmpty()){
return false;
}
Node secondNode = first.next;
first.next = null;
first = secondNode;
size--;
return true;
}
/**
* 取出第i个结点
* 步骤:从头结点进行遍历,取第i个结点
* 时间复杂度:O(n),此操作对于利用数组实现的顺序存储结构,仅需常数阶O(1)即可完成。
* @param index
* @return
*/
public int get(int index) throws Exception {
if(!checkIndex(index)){
throw new Exception("index不合法!");
}
Node curr = first;
for(int i=0;i<index;i++){
curr = curr.next;
}
return curr.data;
}
/**
* 遍历线性表
* 时间复杂度:O(n)
*/
public void displayList(){
Node currNode = first;
while (currNode!=null){
System.out.print(currNode.data+" ");
currNode = currNode.next;
}
System.out.println();
} /**
* 链表是否为空
* @return
*/
public boolean isEmpty(){
return first == null;
} /**
* index是否合法
* @param index
* @return
*/
private boolean checkIndex(int index){
return index >= 0 && index < size;
}
/**
* 链表大小
* @return
*/
public int size() {
return size;
}
public static void main(String []args) throws Exception { MyLinkedList myLinkedList = new MyLinkedList();
//从头部插入
myLinkedList.insertFirst(1);
myLinkedList.insertFirst(2);
myLinkedList.insertFirst(3);
myLinkedList.insertFirst(4);
//遍历线性表中元素
myLinkedList.displayList();
//获取第二个元素
System.out.println(myLinkedList.get(2));
//删除结点
myLinkedList.deleteFirst();
myLinkedList.displayList();
}
}
输出结果
4 3 2 1
2
3 2 1
双端链表
上面罗列了线性表中的几种基本操作,考虑下,如果要提供一个在链表尾部进行插入的操作insertLast,那么由于单链表只保留了指向头结点的应用first,需要从头结点不断通过其next链找后继结点来遍历,时间复杂度为O(n)。其实,我们可以在保留头结点引用的时候,也保留一个尾结点的引用。这样,在从尾部进行插入时就方便多了
双端链表同时保存对头结点和对尾结点的引用
/**
* 指向头结点的引用
*/
private Node first ;
/**
* 指向尾结点的引用
*/
private Node rear;
从尾部进行插入
/**
* 双端链表,从尾部进行插入
* 步骤:将当前尾结点的next链指向新节点即可
* 时间复杂度:O(1)
* @param data
*/
public void insertLast(int data){
Node newNode = new Node(data);
if(isEmpty()){
first = newNode;
rear = newNode;
size++;
return;
}
rear.next = newNode;
rear = newNode;
size++;
}
做其他操作的时候也需注意保持对尾结点的引用,此处不再赘述。
双向链表
再考虑下,如果我们要提供一个删除尾结点的操作,步骤很简单:在删除尾结点的过程中需要将其前驱结点(即倒数第二个结点)的next链引用置为空,但由于我们的链表是单链表,一条道走到黑,要找倒数第二个结点得从头开始遍历,这种情况下,我们就可以考虑使用双向链表。
双向链表的的每一个结点,包含两个指针域,一个指向它的前驱结点,一个指向它的后继结点。
/**
* 删除尾结点
* 主要步骤:1.将rear指向倒数第二个结点 2.处理相关结点的引用链
* 时间复杂度:O(1)
* @return
*/
public void deleteLast() throws Exception {
if(isEmpty()){
throw new Exception("链表为空");
}
Node secondLast = rear.prev;
rear.prev = null;
rear = secondLast;
if(rear == null){
first = null;
}else{
rear.next = null;
}
size--;
}
其他操作同理,在过程中需要同时保持对结点的前驱结点和后继结点的引用,删除操作时,需要注意解除废弃结点的各种引用,便于GC。
总结
本文对数据结构的一些基本概念,逻辑结构和物理结构,线性表等概念进行了基本的阐述。同时,介绍了线性表的顺序存储结构和链式存储结构,对线性表的链式存储结构(单链表,双端链表,双向链表),使用Java语言做了基本实现。数据结构的重要性毋庸置疑,它是软件设计的基石,由于自己非科班出身,虽曾自学过一段时间,也不够系统,最近希望能重新系统地梳理下,本篇就当自己数据结构再学习的开篇吧,共勉。