温故而知新 -＞数据结构 -＞排序

2023-11-18 17:42:22

温故而知新 -＞数据结构 -＞排序

排序

注：想查看其他有关数据结构知识，可点击链接温故而知新 -＞数据结构进行查看！

排序

1. 概念

1）排序：即将一串数据，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。

2）稳定性：假定在待排序的记录序列中，存在多个具有相同的关键字的记录，若经过排序，这些记录的相对次序保持不变，即在原序列中，r[i]=r[j]，且r[i]在r[j]之前，而在排序后的序列中，r[i]仍在r[j]之前，则称这种排序算法是稳定的；否则称为不稳定的。

3）内部排序：数据元素全部放在内存中的排序。
4）外部排序：数据元素太多不能同时放在内存中，根据排序过程的要求不能在内外存之间移动数据的排序。

2. 常见排序算法

常见排序算法可如下图所示进行分类

3. 算法实现

3.1 插入排序

3.1.1 直接插入排序

1）概念

直接插入排序是一种简单的插入排序法，其基本思想是：把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中，直到所有的记录插入完为止，得到一个新的有序序列。

2）结构

当插入第i(i>=1)个元素时，前面的array[0],array[1],…,array[i-1]已经排好序，此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较，找到插入位置即将array[i]插入，原来位置上的元素顺序后移。

比如下图所示

3）总结
直接插入排序的特性总结：

元素集合越接近有序，直接插入排序算法的时间效率越高
时间复杂度：O(N^2)
空间复杂度：O(1)，它是一种稳定的排序算法
稳定性：稳定

3.1.2 希尔排序( 缩小增量排序 )

1）概念

希尔排序法又称缩小增量法。希尔排序法的基本思想是：先选定一个整数，把待排序文件中所有记录分成个组，所有距离为的记录分在同一组内，并对每一组内的记录进行排序。然后，取，重复上述分组和排序的工作。当到达=1时，所有记录在统一组内排好序。

2）结构

数据移动的步长变大，从整体上减少数据移动的次数，提高性能。且在同组数据之间首先会进行插入排序！

3）总结
希尔排序的特性总结：

希尔排序是对直接插入排序的优化。
当gap > 1时都是预排序，目的是让数组更接近于有序。当gap == 1时，数组已经接近有序的了，这样就会很快。这样整体而言，可以达到优化的效果。实现后可以进行性能测试的对比。
希尔排序的时间复杂度不好计算，需要进行推导，推导出来平均时间复杂度： O(N^1.3 ~ N^2）
稳定性：不稳定

3.2 选择排序

基本思想：每一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始位置，直到全部待排序的数据元素排完。

3.2.1 直接选择排序

1）概念

在元素集合array[i]~array[n-1]中选择关键码最大(小)的数据元素，若它不是这组元素中的最后一个(第一个)元素，则将它与这组元素中的最后一个（第一个）元素交换，在剩余的array[i]~array[n-2]（array[i+1]~array[n-1]）集合中，重复上述步骤，直到集合剩余1个元素。

2）结构

3）总结

直接选择排序的特性总结：

直接选择排序思考非常好理解，但是效率不是很好。实际中很少使用
时间复杂度：O(N^2)
空间复杂度：O(1)
稳定性：不稳定

3.2.2 堆排序

1）概念

堆排序(Heapsort) 是指利用堆积树（堆）这种数据结构所设计的一种排序算法，它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆，排降序建小堆。

2）结构

此处内容可参照博客温故而知新 -＞数据结构 -＞树 -＞二叉树 -> 顺序存储。

3）总结

直接选择排序的特性总结：

堆排序使用堆来选数，效率就高了很多。
时间复杂度：O(N*logN)
空间复杂度：O(1)
稳定性：不稳定

3.3 交换排序

基本思想：所谓交换，就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置；
交换排序的特点是：将键值较大的记录向序列的尾部移动，键值较小的记录向序列的前部移动。

3.3.1 冒泡排序

1）概念

重复地走访过要排序的元素列，依次比较两个相邻的元素，如果顺序错误就把他们交换过来。走访元素的工作是重复地进行直到没有相邻元素需要交换，也就是说该元素列已经排序完成。

2）结构

3）总结

冒泡排序的特性总结：

冒泡排序是一种非常容易理解的排序
时间复杂度：O(N^2)
空间复杂度：O(1)
稳定性：稳定

3.3.2 快速排序

1）概念
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法，其基本思想为：任取待排序元素序列中的某元素作为基准值，按照该排序码将待排序集合分割成两子序列，左子序列中所有元素均小于基准值，右子序列中所有元素均大于基准值，然后最左右子序列重复该过程，直到所有元素都排列在相应位置上为止。

将区间按照基准值划分为左右两半部分的常见方式有：

hoare版本
挖坑法
前后指针版本

2）结构

最简单的快速排序结构如下，即对 int data[] = {27,38,13,49,76,97,65,49} 进行排序

3）总结

快速排序的特性总结：

快速排序整体的综合性能和使用场景都是比较好的，所以才敢叫快速排序
时间复杂度：O(N*logN)
空间复杂度：O(logN)
稳定性：不稳定

3.4 归并排序

1）概念

基本思想：归并排序（MERGE-SORT）是建立在归并操作上的一种有效的排序算法,该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并。

2）结构
结构举例如下

3）总结

归并排序的特性总结：

归并的缺点在于需要O(N)的空间复杂度，归并排序的思考更多的是解决在磁盘中的外排序问题。
时间复杂度：O(N*logN)
空间复杂度：O(N)
稳定性：稳定

3.5 非比较排序

此处将介绍一下计数排序！

1）概念

思想：计数排序又称为鸽巢原理，是对哈希直接定址法的变形应用。操作步骤：

统计相同元素出现次数
根据统计的结果将序列回收到原来的序列中

２）结构

案例如下

其中A为原序列，然后将A中数据元素进行统计形成B，在之后根据B中元素值以及对应的下标，就可对A中的数据进行排序从而获得C！

３）总结

计数排序的特性总结：

计数排序在数据范围集中时，效率很高，但是适用范围及场景有限。
时间复杂度：O(MAX(N,范围))
空间复杂度：O(范围)
稳定性：稳定

4. 程序实现

本篇博客将基于上述内容，实现部分排序方法，比如交换排序中的三种快速排序、递归与非递归的归并排序、非比较排序等。

由于此处内容较多，若要查看可点击下述链接：

5. 总结

用两张图从排序算法复杂度及稳定性分析总结一下，如下

以上为本篇博客内容，因为其中有些内容用了别人的，但找不到原始来源，所以 侵权删~

码农公寓