数据结构学习笔记(八大排序算法)整理与总结

数据结构学习笔记(八大排序算法)整理与总结

排序的相关概念

排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。

稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

内部排序:数据元素全部放在内存中的排序。

外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。

排序算法的评价指标: 主要看时间复杂度空间复杂度(排序所需辅助空间),以及算法本身的复杂度。

排序算法的思维图:
数据结构学习笔记(八大排序算法)整理与总结
算法复杂度:
数据结构学习笔记(八大排序算法)整理与总结

排序的思想和实现

这里主要讨论内部排序,排序的手段分为插入、交换、选择、归并、基数排序等。时间复杂度为O(logn)、O(n)、O(n²)的排序成为简单排序,时间复杂度如果出现对数阶,那么就是先进的排序方法。

插入排序

直接插入排序

直接插入排序的思想是指每次将一个待排序的元素按大小插入到前面己排好序的有序表中,直到全部元素排序完成。最开始默认当前有序表的第0个元素成为一个已经排序好的有序的子数组 直接插入排序的时间复杂度为O( n2 )

以下为直接插入排序的几种方法:
// An highlighted block
//直接插入排序--从前往后比较
void InsertSort_1(int ar[], int left, int right)
{
	for(int i=left+1; i<right; ++i)//i从第二个数据开始
	{
		int k=left;
		while(ar[i] > ar[k])
			k++;
		int tmp = ar[i];//保存要插入的数据
		for(int j=i; j>k; --j)
			ar[j] = ar[j-1];
		ar[k] = tmp;
	}
}

//直接插入排序--从后往前比较
void InsertSort_2(int ar[], int left, int right)
{
	for(int i=left+1; i<right; ++i)
	{
		int j = i;
		while(j>left && ar[j]<ar[j-1])
		{
			Swap(&ar[j], &ar[j-1]);//调动函数的话效率会降低
			j--;
		}
	}
}

//直接插入排序--从后往前比较 --不调用交换函数
void InsertSort_3(int ar[], int left, int right)
{
	for(int i=left+1; i<right; ++i)
	{
		int j = i;
		int tmp = ar[i];
		while(j>left && tmp<ar[j-1])
		{
			ar[j] = ar[j-1];//数据往后移动
			j--;
		}
		ar[j] = tmp;//当j不小于前边的数据,把tmp的数据交赋给j
	}
}

//直接插入排序--从后往前比较 --哨兵位
void InsertSort_4(int ar[], int left, int right)
{
	for(int i=left+1; i<right; ++i)
	{
		ar[0] = ar[i]; //哨兵位
		int j = i;
		while(ar[0] < ar[j-1])
		{
			ar[j] = ar[j-1];//移动数据
			j--;
		}
		ar[j] = ar[0];
	}
}

哨兵位:
采用哨兵位的直接插入排序,是要将待排序序列的第一个位置留出来设立为哨兵位置,所以需要注意的在定义序列时要多给一个空间。这样做的好处就是不用设立临时变量

**测试排序的效率**
// An highlighted block
void TestSortEfficiency()
{
	srand(time(0));
	int n = 10000;
	int *a1 = (int*)malloc(sizeof(int) * n);
	int *a2 = (int*)malloc(sizeof(int) * n);
	int *a3 = (int*)malloc(sizeof(int) * n);
	int *a4 = (int*)malloc(sizeof(int) * n);
	int *a5 = (int*)malloc(sizeof(int) * n);
	for(int i=0; i<n; ++i)
	{
		a1[i] = rand();//随机数
		a2[i] = a1[i];
		a3[i] = a1[i];
		a4[i] = a1[i];
		a5[i] = a1[i];
	}

	unsigned long start = clock();//无符号长整型定义开始的时间
	InsertSort_1(a1, 0, n);
	unsigned long end   = clock();//结束时间
	printf("InsertSort_1 : %u\n", end-start);

	start = clock();
	InsertSort_2(a2, 0, n);
	end   = clock();
	printf("InsertSort_2 : %u\n", end-start);

	start = clock();
	InsertSort_3(a3, 0, n);
	end   = clock();
	printf("InsertSort_3 : %u\n", end-start);

	start = clock();
	InsertSort_4(a4, 0, n);
	end   = clock();
	printf("InsertSort_4 : %u\n", end-start);

	start = clock();
	BinInsertSort(a5, 0, n);
	end   = clock();
	printf("BinInsertSort : %u\n", end-start);

	free(a1);
	free(a2);
	free(a3);
	free(a4);
	free(a5);
}

总结:直接插入排序简单便捷,容易实现。当待排序记录的数量n很小时,这是一种很好的排序方法。但是当排序序列中记录数量n很大,则不宜采用直接插入排序。可以从“比较”和“移动”这两种操作的次数着手改变。除了基数排序外,每一种排序遵循的一个规则基本上就是“比较,移动”。

折半插入排序

折半插入排序是对直接插入排序的优化,折半插入排序所需附加存储空间和直接插入排序相同,从时间上比较,折半插入排序仅减少了关键字间的比较次数,而记录的移动次数不变。因此,折半插入排序的时间复杂度仍为O(n2)。

折半插入排序减少了比较次数,但是移动的次数还是一样的
// An highlighted block
//折半插入
void BinInsertSort(int *ar, int left, int right)
{
	for(int i=left+1; i<right; ++i)
	{
		int tmp = ar[i];
		//二分查找插入位置
		int low = left;
		int high = i-1;
		while(low <= high)
		{
			int mid = (low + high) / 2;
			if(tmp > ar[mid])
				low = mid + 1;
			else
				high = mid - 1;
		}

		//移动数据
		for(int j=i; j>low; --j)
			ar[j] = ar[j-1];
		ar[low] = tmp;
	}
}

总结:
稳定性:稳定
时间复杂度:O(n^2)

希尔排序

概念:希尔排序( Shell’s Sort)又称“缩小增量排序”( Diminishing Increment Sort),是插入排序的一种, 因D.L.Shell 于1959 年提出而得名。直接插人排序,当待排序的记录个数较少且待排序序列的关键字基本有序时,效率较高。希尔排序基于以上两点,从“减少记录个数”和“序列基本有序”两个方面对直接插入排序进行了改进。

基本思想
先将整个待排记录序列分割成若干子序列,分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行一次直接插入排序。

希尔排序特点:
(1)缩小增量
(2)多遍插入排序

希尔排序步骤:
希尔排序实质上是采用分组插人的方法。先将整个待排序记录序列分割成几组,从而减少参与直接插入排序的数据量,对每组分别进行直接插人排序,然后增加每组的数据量,重新分组。这样当经过几次分组排序后,整个序列中的记录“基本有序”时,再对全体记录进行一次直接插人排序。
数据结构学习笔记(八大排序算法)整理与总结
时间复杂度:
数据结构学习笔记(八大排序算法)整理与总结
空间复杂度:
O(1)

稳定性:
不稳定 (如图中“上划线49”和“49”的相对位置在排序前后变了,故不稳定)

**希尔排序**
// An highlighted block
void ShellSort(int ar[], int left, int right)
{
	int gap = right - left;
	while(gap > 1)
	{
		gap = gap / 3 + 1;  //设计文档
		for(int i=left+gap; i<right; ++i)
		{
			if(ar[i] < ar[i-gap])
			{
				int tmp = ar[i];
				int end = i;
				while(end>left && tmp<ar[end-gap])
				{
					ar[end] = ar[end-gap];
					end -= gap;
				}
				ar[end] = tmp;
			}
		}
	}
}

选择排序

直接选择排序

概念:直接选择排序又称简单选择排序,是一种不稳定的排序方法,其是选择排序中最简单一种,其基本思想是:第 i 趟排序再待排序序列 a[i]~a[n] 中选取关键码最小的记录,并和第 i 个记录交换作为有序序列的第 i 个记录
其实现利用双重循环,外层 i 控制当前序列最小值存放的数组元素位置,内层循环 j 控制从 i+1 到 n 序列中选择最小的元素所在位置 k

具体的排序过程为:

1.将整个记录序列划分为有序区和无序区,初始时有序区为空,无序区含有待排序的所有记录
2.在无序区选择关键码最小的记录,将其与无序区中的第一个元素,使得有序区扩展一个记录,同时无序区减少了一个记录
3.不断重复步骤 2,直到无序区只剩下一个记录为止

**直接插入排序:**
// An highlighted block
int GetMinIndex(int ar[], int left, int right)
{
	int min_value = ar[left];
	int index = left;
	for(int i=left+1; i<right; ++i)
	{
		if(ar[i] < min_value)
		{
			min_value = ar[i];
			index = i;
		}
	}
	return index;
}
void SelectSort(int ar[], int left, int right)
{
	for(int i=left; i<right-1; ++i)
	{
		int index = GetMinIndex(ar, i, right);
		if(index != i)
		{
			int tmp = ar[i];
			ar[i] = ar[index];
			ar[index] = tmp;
		}
	}
}

堆排序

基本思想:

1.首先将待排序的数组构造成一个大堆,此时,整个数组的最大值就是堆结构的顶端

2.将顶端的数与末尾的数交换,此时,末尾的数为最大值,剩余待排序数组个数为n-1

3.将剩余的n-1个数再构造成大堆,再将顶端数与n-1位置的数交换,如此反复执行,便能得到有序数组

构造堆
将无序数组构造成一个大根堆(升序用大根堆,降序就用小根堆)

每次新插入的数据都与其父结点进行比较,如果插入的数比父结点大,则与父结点交换,否则一直向上交换,直到小于等于父结点,或者来到了顶端

固定最大值再构造堆

此时,我们已经得到一个大根堆,下面将顶端的数与最后一位数交换,然后将剩余的数再构造成一个大堆

**堆排序**
// An highlighted block
void _ShiftDown(int ar[], int left, int right, int start)
{
	int n = right - left;
	int i = start;   //父节点
	int j = 2*i + 1; //左子树

	int tmp = ar[i];
	while(j < n)
	{
		if(j+1<n && ar[j]<ar[j+1])
			j++;
		if(tmp < ar[j])
		{
			ar[i] = ar[j];
			i = j;
			j = 2*i+1;
		}
		else
			break;
	}
	ar[i] = tmp;
}
void HeapSort(int ar[], int left, int right)
{
	//建堆
	int n = right - left;
	int curpos = (n - 1) / 2 + left;
	while(curpos >= left)
	{
		_ShiftDown(ar, left, right, curpos);
		curpos--;
	}

	//排序
	int end = right - 1;
	while(end > left)
	{
		int tmp = ar[end];
		ar[end] = ar[left];
		ar[left] = tmp;

		_ShiftDown(ar, left, end,  left);
		end--;
	}
}

堆排序的时间复杂度为O(nlogn)
空间复杂度为O(1)
综合对比堆排序的效率远比上述其他排序算法高

交换排序

冒泡排序

冒泡排序是比较基础的排序算法之一,其思想是相邻的元素两两比较,较大的数下沉,较小的数冒起来,这样一趟比较下来,最大(小)值就会排列在一端。整个过程如同气泡冒起,因此被称作冒泡排序。
冒泡排序的步骤是比较固定的:
①比较相邻的元素。如果第一个比第二个大,就交换他们两个。
②每趟从第一对相邻元素开始,对每一对相邻元素作同样的工作,直到最后一对。
③针对所有的元素重复以上的步骤,除了已排序过的元素(每趟排序后的最后一个元素),直到没有任何一对数字需要比较。

下面为冒泡排序的三种方式:
// An highlighted block
void BubbleSort_1(int ar[], int left, int right)
{
	int n = right - left;
	for(int i=0; i<n-1; ++i)
	{
		for(int j=0; j<n-1-i; ++j)
		{
			if(ar[j] > ar[j+1])
			{
				Swap(&ar[j], &ar[j+1]);
			}
		}
	}
}

void BubbleSort_2(int ar[], int left, int right)
{
	int n = right - left;
	for(int i=0; i<n-1; ++i)
	{
		for(int j=0; j<n-1-i; ++j)
		{
			if(ar[j] > ar[j+1])
			{
				int tmp = ar[j];
				while(j<right-1 && tmp>ar[j+1])
				{
					ar[j] = ar[j+1];
					j++;
				}
				ar[j] = tmp;
			}
		}
	}
}
//记下最后一次交换的位置,后边没有交换,必然是有序的,然后下一次排序从第一个比较到上次记录的位置结束即可
void BubbleSort_3(int ar[], int left, int right)
{
	int n = right - left;
	bool is_change = false;
	for(int i=0; i<n-1; ++i)
	{
		for(int j=0; j<n-1-i; ++j)
		{
			if(ar[j] > ar[j+1])
			{
				int tmp = ar[j];
				while(j<right-1 && tmp>ar[j+1])
				{
					ar[j] = ar[j+1];
					j++;
				}
				ar[j] = tmp;
				is_change = true;
			}
		}
/*如果没有交换过元素,则已经有序,不再进行接下来的比较*/
		if(!is_change)
			break;
		else
			is_change = false;
	}
}

在冒泡排序中,遇到相等的值,是不进行交换的,只有遇到不相等的值才进行交换,所以是稳定的排序方式
冒泡排序总的平均时间复杂度为O(n2)
冒泡排序适用于数据量很小的排序场景,因为冒泡的实现方式较为简单

快速排序

快速排序也是一种较为基础的排序算法,其效率比冒泡排序算法有大幅提升。因为使用冒泡排序时,一趟只能选出一个最值,有n个元素最多就要执行n - 1趟比较。而使用快速排序时,一次可以将所有元素按大小分成两堆,也就是平均情况下需要logn轮就可以完成排序

快速排序的思想是:
每趟排序时选出一个基准值,然后将所有元素与该基准值比较,并按大小分成左右两堆,然后递归执行该过程,直到所有元素都完成排序。

快速排序的步骤如下:
①先从数列中取出一个数作为基准数。
②分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边。
③再对左右区间重复第二步,直到各区间只有一个数。

以下为快速排序的不同版本代码:
// An highlighted block
int GetMidIndex(int ar[], int left, int right)
{
	int low = left, high = right-1;
	int mid = (low + high) / 2;
	if(ar[low]<ar[mid] && ar[mid]<ar[high])
		return mid;
	if(ar[mid]<ar[low] && ar[low]<ar[high])
		return low;
	return high;
}

//hoare版本
int _Partition_1(int ar[], int left, int right)
{
	int low=left, high = right-1;
	int key = ar[low];
	while(low < high)
	{
		while(low<high && ar[high]>key)
			high--;
		Swap(&ar[low], &ar[high]);

		while(low<high && ar[low]<=key)
			low++;
		Swap(&ar[low], &ar[high]);
	}
	return low;
}

// 挖坑法
int _Partition_2(int ar[], int left, int right)
{
	int low=left, high = right-1;
	int key = ar[low];
	while(low < high)
	{
		while(low<high && ar[high]>key)
			high--;
		ar[low] = ar[high];

		while(low<high && ar[low]<=key)
			low++;
		ar[high] = ar[low];
	}
	ar[low] = key;
	return low;
}

//前后指针法
int _Partition_3(int ar[], int left, int right)
{
	//三者取中
	int index = GetMidIndex(ar, left, right);
	if(index != left)
		Swap(&ar[left], &ar[index]);
	/

	int key = ar[left];
	int pos = left;
	for(int i=left+1; i<right; ++i)
	{
		if(ar[i] < key)
		{
			pos++;
			if(pos != i)
			{
				Swap(&ar[pos], &ar[i]);
			}
		}
	}
	Swap(&ar[left], &ar[pos]);
	return pos;
}

#define M 5
void QuickSort(int ar[], int left, int right)
{
	if(left >= right)
		return;

	if(right - left <= M)
	{
		InsertSort_3(ar, left, right);
	}
	else
	{
		int pos = _Partition_3(ar, left, right); //key
		QuickSort(ar, left, pos);
		QuickSort(ar, pos+1, right);
	}
}

#include"Stack.h"
void QuickSort_Nor(int ar[], int left, int right)
{
	LinkStack st;
	LinkStackInit(&st);
	LinkStackPush(&st, left);
	LinkStackPush(&st, right);

	while(!LinkStackEmpty(&st))
	{
		right = LinkStackTop(&st);
		LinkStackPop(&st);
		left = LinkStackTop(&st);
		LinkStackPop(&st);

		if(right - left <= 1)
			continue;

		int pos = _Partition_3(ar, left, right);
		LinkStackPush(&st, pos+1); //
		LinkStackPush(&st, right);

		LinkStackPush(&st, left);
		LinkStackPush(&st, pos);
	}
}

归并排序

利用递归与分治技术将数据序列划分为越来越小的半子表,再对半子表排序,最后再用递归步骤将排好序的半子表合并成为越来越大的有序序列。

原理:对于给定的一组记录,首先将两个相邻的长度为1的子序列进行归并,得到n/2个长度为2或者1的有序子序列,在将其两两归并,反复执行此过程,直到得到一个有序的序列为止。
数据结构学习笔记(八大排序算法)整理与总结

归并排序:
// An highlighted block
void _MergeSort(int ar[], int left, int right, int *tmp)
{
	//分解
	if(left >= right)
		return;
	int mid = (left + right) / 2;
	_MergeSort(ar, left, mid, tmp);
	_MergeSort(ar, mid+1, right, tmp);

	//归并
	int begin1, end1, begin2, end2;
	begin1 = left, end1 = mid;  //左数据
	begin2 = mid+1, end2 = right; //右数据

	int k = left;
	while(begin1<=end1 && begin2<=end2)
	{
		if(ar[begin1] < ar[begin2])
			tmp[k++] = ar[begin1++];
		else
			tmp[k++] = ar[begin2++];
	}

	while(begin1 <= end1)
		tmp[k++] = ar[begin1++];
	while(begin2 <= end2)
		tmp[k++] = ar[begin2++];

	memcpy(ar+left, tmp+left, sizeof(int) * (right-left+1));
}

void MergeSort(int ar[], int left, int right)
{
	int n = right - left;
	int *tmp = (int *)malloc(sizeof(int) * n);

	_MergeSort(ar, left, right-1, tmp);

	free(tmp);
}

基数排序

步骤:

(1)分配,先从个位开始,根据位值(0-9)分别放到0~9号桶中(比如53,个位为3,则放入3号桶中)

(2)收集,再将放置在0~9号桶中的数据按顺序放到数组中
数据结构学习笔记(八大排序算法)整理与总结
数据结构学习笔记(八大排序算法)整理与总结

基数排序:
// An highlighted block
#include"List.h"
#define K 3
#define RADIX 10

List list[RADIX];

//    k
//2 7 8
int GetKey(int value, int k)
{
	int key;
	while(k >= 0)
	{
		key = value % 10;
		value /= 10;
		k--;
	}
	return key;
}
void Distribute(int ar[], int left, int right, int k) //k代表第k次分发
{
	for(int i=left; i<right; ++i)
	{
		int key = GetKey(ar[i], k);
		ListPushBack(&list[key], ar[i]);
	}
}

void Collect(int ar[])
{
	int k = 0;
	for(int i=0; i<RADIX; ++i)
	{
		ListNode *p = list[i];
		while(p != NULL)
		{
			ar[k++] = p->data;
			p = p->next;
		}
	}

	for(int i=0; i<RADIX; ++i)
		ListClear(&list[i]);
}

void RadixSort(int ar[], int left, int right)
{
	//初始化基数
	for(int i=0; i<RADIX; ++i)
		ListInit(&list[i]);

	for(int i=0; i<K; ++i)
	{
		//分发
		Distribute(ar, left, right, i);

		//回收
		Collect(ar);
	}
}

总结

排序算法比较
数据结构学习笔记(八大排序算法)整理与总结
从平均情况看:堆排序、归并排序、快速排序胜过希尔排序。

从最好情况看:冒泡排序和直接插入排序更胜一筹。

从最差情况看:堆排序和归并排序强过快速排序。

虽然直接插入排序和冒泡排序速度比较慢,但是当初始序列整体或局部有序是,这两种算法的效率比较高。当初始序列整体或局部有序时,快速排序算法效率会下降。当排序序列较小且不要求稳定性是,直接排序效率较好;要求稳定性时,冒泡排序法效率较好。

参考博客

https://blog.csdn.net/qq_41998576/article/details/81635566
https://blog.csdn.net/qq_41998576/article/details/81635566

上一篇:AR远程协助在疫情中起到了怎样的作用?|effiarAR工业云平台


下一篇:光学镜头与模组