快排和归并

目录

前言

 快速排序

相遇位置一定比key小的原理(大):

避免效率降低方法(快排优化)

三数取中(选key优化)

小区间优化

hoare版本快排

挖坑法快排

前后指针快排

非递归快排

归并排序

非递归归并

总结:​编辑


前言

本篇讲解上一篇没有讲解的快速排序和归并排序;

上篇排序:常见排序算法-****博客

本期专栏:算法_海盗猫鸥的博客-****博客

个人主页:海盗猫鸥-****博客

这两种排序思想较为复杂,和堆排序、希尔排序,都为效率较高的排序算法;且快排和归并都分为递归和非递归两种实现方法。

 快速排序

hoare方法原理解析:升序

图中循环开始时L指向比较区间的最左,R指向比较区间的最右位置

1. 假设确定最左的数为key值

2. 则R--寻找小于key的值;L++寻找大于key的值;找到后交换R和L所指向位置的值

3. 如此循环下去,直到R等于L,循环结束,将key值和相遇位置(一定小于key)的值进行交换,并将key指向相遇位置

4.完成一次循环之后,小于key的值都在此时key位置的左边,大于key的值都在key位置右边

5.将此时的key位置作为分界点,分为左右俩区间进行递归

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
void QuickSort(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	//以key为基准
	int keyi = left;
	int begin = left;
	int end = right;
	while (begin < end)
	{
		//先找小,后找大,能保证begin和end相遇位置的数据一定小于keyi位置的数据
		//右边找小
		while (begin < end && arr[end] >= arr[keyi])
		{
			end--;
		}
		//左边找大
		while (begin < end && arr[begin] <= arr[keyi])
		{
			begin++;
		}
		Swap(&arr[begin], &arr[end]);
	}
	//
	Swap(&arr[keyi], &arr[begin]);
	keyi = begin;
	QuickSort(arr, left, keyi - 1);
	QuickSort(arr, keyi + 1, right);
}


相遇位置一定比key小的原理(大):

升序:

left做key,保证R先走,就能保证相遇位置一定小于key(相对的,right做key时,就要让L先走,保证相遇位置比key大)

降序排列时则相反

因为在上一次交换中,L与R交换值,L所指向的位置就一定已经是小于key的值了,此时到下一个循环,R先再往前走L还没有动,所以当R遇到L时就一定是上一轮交换过来的,小于key的值,所以相遇位置一定小于key;

反之如果先让L先走,那么相遇位置就一定是上一轮交换完成后,大于key的值所在的位置,也就是上一轮R所在位置,一定大于key值

当前版本的快排,当数据本身就有序时,快排的时间复杂度将会退化为N^2

并且有栈溢出的风险,递归深度太深将导致栈溢出,因为函数栈帧空间较小

当每次的key越接近中间位置时,快排的时间复杂度约为O(N*logN):;​

避免效率降低方法(快排优化)

三数取中(选key优化)

想办法使key的值更接近中间,

  1. 使用随机值赋值key(可以避免效率降低到O(N^2),但随机性任然较大);

  2. 三数取中

    将排序区间的left,right和位于最中间的数比较;取大小居中的那个数作为key值;但为保证后续排序逻辑不变,要将key值和最左left位置上的值进行交换

小区间优化

假设每次key都比较接近中间位置,那么每次区间分割都可以大致看为二分,则其递归的形式就形似二叉树,效率最高;但当数据个数较少时,使用递归来排序是不太合适的

所以当区间数据个数较少时,我们可以直接使用插入排序

hoare版本快排

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

//三数取中
int GetMidi(int* arr, int left, int right)
{
	//返回三个数中值最小的下标
	int midi = (left + right) / 2;
	if (arr[left] > arr[midi])
	{
		if (arr[midi] > arr[right])
			return midi;
		else if (arr[left] > arr[right])
			return right;
		else
			return left;
	}
	else//arr[left] < arr[midi]
	{
		if (arr[midi] < arr[right])
			return midi;
		else if (arr[left] < arr[right])
			return right;
		else
			return left;
	}

}

//hoare
O(N*logN)
void QuickSort(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}

	//小区间优化,不再采取递归的方式
	if ((right - left + 1) < 10)
	{
		//传递区间的起始地址arr + left
		InsertSort(arr + left, right - left + 1);
	}
	else
	{

		//以key为基准
		//固定以left为key时,当数组倒序时,将导致时间复杂度退化为O(N^2);
		//int keyi = left;

		//三数取中
		int midi = GetMidi(arr, left, right);
		Swap(&arr[left], &arr[midi]);//将要作为key的值交换到最左边
		int keyi = left;


		int begin = left;
		int end = right;
		while (begin < end)
		{
			//先找小,后找大,能保证begin和end相遇位置的数据一定小于keyi位置的数据
			//右边找小
			while (begin < end && arr[end] >= arr[keyi])
			{
				end--;
			}
			//左边找大
			while (begin < end && arr[begin] <= arr[keyi])
			{
				begin++;
			}
			Swap(&arr[begin], &arr[end]);
		}
		//
		Swap(&arr[keyi], &arr[begin]);
		keyi = begin;
		QuickSort(arr, left, keyi - 1);
		QuickSort(arr, keyi + 1, right);
	}
}


挖坑法快排

原理解析:(升序)

1. 最左位置视为初始坑位,并将其值赋值给key存储起来,L指向最左边(此时L所指就是坑位),R指向最右位置;

2. R开始从右往左找小于key的值,找到后,将这个位置的值赋值给坑位,并将这个位置视为新的坑位;

3. 接着L从左往右找大于key的值,找到后,将这个位置的值赋值给坑位,并将这个位置视为新的坑位。

4. 直到L和R相遇(同时指向坑位),将key值赋值给坑位。此时小于key的值就都在坑位前,大于key‘的值都在坑位后

5. 以最后的坑位为分界,左右区间递归

void QuickSort(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	//将第一个数据视为坑;
	int keni = left;
	int key = arr[keni];
	int begin = left;
	int end = right;
	while (begin < end)
	{
		//找到小于key的值,填到坑中
		while (begin < end && arr[end] > key)
		{
			end--;
		}
		arr[keni] = arr[end];
		keni = end;
		while (begin < end && arr[begin] < key)
		{
			begin++;
		}
		arr[keni] = arr[begin];
		keni = begin;
	}
	//相遇后,将key值赋给坑的位置
	arr[keni] = key;
	QuickSort(arr, left, keni - 1);
	QuickSort(arr, keni + 1, right);
}

前后指针快排

原理解析(升序):

1. 以最左为key值,prev从排序区间的第一个位置开始,cur=prev+1开始

2. 当cur所指位置值小于key值时,prev++后将prev位置和cur位置的数据交换位置,然后cur++继续寻找下一个符合条件的数据;

3. cur所指位置值大于key时,直接cur++即可;不论cur所指是否满足交换条件,cur始终都要++;

(实际就是让大于key的值都放在prev和cur所指的区间之间,并将这些值通过交换一步步送到数组的右边);

4. 直到cur超出数组范围,此时prev所指的位置,左边就全是小于key的值,右边就全是大于key的值;

5. 交换prev位置和key位置的数据,将key重新指向prev,本次循环结束

6. 然后以新key位置为分界,左右区间递归

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
void QuickSort(int* arr, int left, int right)
{
	if (left >= right)
		return;
	//小区间优化
	if ((right - left + 1) < 10)
	{
		//传递区间的起始地址arr + left
		InsertSort(arr + left, right - left + 1);
	}
	else
	{
		//三数取中(此优化后,逻辑会改变,原理分析处为没有三数取中优化的解析)
		int midi = GetMidi(arr, left, right);
		Swap(&arr[left], &arr[midi]);//将要作为key的值交换到最左边

		int keyi = left;
		int prev = left, cur = left + 1;
		//prev和cur中间都为大于key的值
		while (cur <= right)
		{
			if (arr[cur] < arr[keyi] && ++prev)
				Swap(&arr[prev], &arr[cur]);
			cur++;
		}
		Swap(&arr[keyi], &arr[prev]);
		keyi = prev;
		QuickSort(arr, left, keyi - 1);
		QuickSort(arr, keyi + 1, right);
	}
}

非递归快排

使用栈来模拟递归的区间分解模式;

1. 循环每走一次相当于之前的一次递归;

2. 取栈顶区间,单趟排序,然后右左子区间入栈(栈后进先出)

代码:

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
//非递归快排
//使用栈模拟递归分区逻辑(DFS深度优先)
//使用队列模拟(BFS广度优先)
void QuickSortNonR(int* arr, int left, int right)
{
	//创建栈,存入右左区间
	ST st;
	STInit(&st);
	STPush(&st,right);
	STPush(&st, left);
	//一次循环就是相当于一次递归
	while (!STEmpty(&st))
	{
		//取区间
		//栈先进后出,先出的为区间左边界
		int begin = STTop(&st);
		STPop(&st);
		int end = STTop(&st);
		STPop(&st);


		//排序(前后指针法)
		int keyi = begin;
		int prev = begin, cur = begin + 1;
		//prev和cur中间都为大于key的值
		while (cur <= end)
		{
			if (arr[cur] < arr[keyi] && ++prev)
				Swap(&arr[prev], &arr[cur]);
			cur++;
		}
		Swap(&arr[keyi], &arr[prev]);
		keyi = prev;


		//存储右左区间
		if (keyi + 1 < end)//keyi + 1 < end说明还有两个数以上
		{
			STPush(&st, end);
			STPush(&st, keyi + 1);
		}

		if (begin < keyi - 1)
		{
			STPush(&st, keyi - 1);
			STPush(&st, begin);
		}
	}
}

快速排序的特性总结:

  1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序,上述几种在实际使用中效率差别不大
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(logN)(递归损耗)
  4. 稳定性:不稳定

归并排序

原理解析(升序):

1. 将数组从中间分为左右两个区间,

2. 如果左右区间不有序,就继续分解左右数组,直到左右区间中都只存在一个数时,左右区间就一定有序(一个单独的数据一定有序

3. 那么如果左右区间有序,就分别从左右区间的第一个数开始比较,将左右区间中的数按照升序插入到临时数组中,完成后,临时数组中就是一个顺序结构

上文动图只显示了合并的思想,分解的思想过程是由递归过程来实现

代码:

void _MergeSort(int* arr, int* tmp, int begin, int end)
{
	if (begin == end)
		return;
	//将区间从中间分为左右区间
	int midi = (begin + end) / 2;

	int begin1 = begin;
	int end1 = midi;
	int begin2 = midi + 1;
	int end2 = end;
	//[left,midi][midi+1,right]
	_MergeSort(arr, tmp, begin1, end1);
	_MergeSort(arr, tmp, begin2, end2);
	int i = begin;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (arr[begin1] < arr[begin2])//小的先插入tmp
		{
			tmp[i++] = arr[begin1++];
		}
		else
		{
			tmp[i++] = arr[begin2++];
		}
	}
	//将没有完成插入的一边全部插入到tmp
	while (begin1 <= end1)
	{
		tmp[i++] = arr[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = arr[begin2++];
	}
	//排序结果
	memcpy(arr+ begin, tmp + begin, sizeof(int) * (end - begin + 1));
}

//归并排序
void MergeSort(int* arr, int n)
{
	//假设左右区间都为有序
	//取左右区间小的那个数插入新数组
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail!");
		return;
	}
    //排序核心
	_MergeSort(arr, tmp, 0, n - 1);

	free(tmp);
	tmp = NULL;
}

注意:区间划分问题

在进行左右分区时,不能使用[left,midi-1][midi,right]来分区

由于midi是整形相除的结果,所以存在数据丢失的情况,若一个以区间[2,3]为例,midi=2;

则此时再按照midi分区,右区间仍然为[2,3],程序将陷入无限递归从而崩溃,而如果按照[left,midi][midi+1,right]来区分区间,则右区间为[3,3],满足递归条件就返回了,不会导致程序出错

非递归归并

思路:
使用循环直接模拟归并合并的过程

理想数组思路图解(数据个数等于gap)

越界问题解析:

参考代码:

//归并排序非递归
void MergeSortNonR(int* arr, int n)
{
	//循环模拟
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail!");
		return;
	}

	//两组begin,end分别表示归并的左右两组
	int begin1, end1;
	int begin2, end2;
	int gap = 1;

	while (gap < n)
	{
		for (int i = 0; i < n; i += gap * 2)
		{
			//i为每次比较的左右两组,最左边的起始位置
			begin1 = i;
			end1 = i + gap - 1;
			begin2 = i + gap;
			end2 = i + 2 * gap - 1;
			int j = i;

			//printf("[%d,%d][%d,%d]", begin1, end1, begin2, end2);

			if (begin2 >= n)
				break;
			if (end2 >= n)
				end2 = n - 1;
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (arr[begin1] <= arr[begin2])//=保证稳定性
					tmp[j++] = arr[begin1++];
				else
					tmp[j++] = arr[begin2++];
			}
			//printf(" ");
			while (begin1 <= end1)
				tmp[j++] = arr[begin1++];
			while (begin2 <= end2)
				tmp[j++] = arr[begin2++];
			//每归并一组左右区间,就拷贝一次
			memcpy(arr + i, tmp + i, sizeof(int) * (end2 - i + 1));
		}
		//memcpy(arr, tmp, sizeof(int) * (n - 1));
		gap *= 2;
		//printf("\n");
	}

	free(tmp);
	tmp = NULL;
}

归并排序的特性总结:

  1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(N)(额外开辟空间)
  4. 稳定性:稳定

总结:

排序的介绍到这里就完结啦~

欢迎大家继续关注我的博客~

上一篇:【网络安全】SQL注入-一、什么是SQL注入


下一篇:shell脚本_永久环境变量和字符串操作