排序算法可以说是计算机专业学生要学习的最基础的算法,但其实也是最重要的,现在大部分互联网公司笔试面试也都会涉及到排序算法的知识。除了了解思想之外,还应该动手写一写,分析一些具体思路、时间复杂度、空间复杂度和稳定性等。
我们面试讨论小分队也简单讨论了一下排序算法,为了加深记忆,我自己也动手写了一些代码(Linux平台写的,自己测试是通过了),并做一些分析(由于水平较水,代码可能有误!)。
9种排序算法分别为:选择排序、冒泡排序、插入排序、希尔排序、归并排序、堆排序、快速排序、计数排序、基数排序!
1. 选择排序
基本思想:从第一个位置开始依次选择该位置的元素,第i次扫描就可以选出第i小的元素,思想很简单,现在用的较少。
特点:平均时间复杂度O(n^2),最坏时间复杂度O(n^2),额外空间O(1),不稳定排序(举例:序列5 8 5 2 9, 第一遍选择第1个元素5会和2交换,原序列中2个5的相对前后顺序就被破坏了),n较小时较好!
代码:
void select_sort(int *a, int n) { for(inti = 1; i <= n; i++) { intmin_pos = i; for(intj = i+1; j <= n; j++) if(a[j] < a[min_pos]) min_pos = j; if(min_pos != i) { inttemp = a[i]; a[i] = a[min_pos]; a[min_pos] = temp; } } }
2. 冒泡排序
基本思想:顾名思义,每一趟都通过相邻元素两两比较,通过交换将较小的元素往前移动,一趟下来就可以将最小的元素(气泡)移动到最前面。一般会加一个标志flag,若一趟扫描没有任何元素交换,则说明序列已经有序,flag为false,直接退出。
特点:平均时间复杂度O(n^2),最坏时间复杂度O(n^2),额外空间O(1),稳定排序(因为比较和交换都是两相邻元素,相等时不交换),n较小时较好!
代码:
void bubble_sort(int *a, int n) { boolflag =false; for(inti = 1; i <= n; i++) { for(intj = n; j > i; j--) if(a[j] < a[j-1]) { inttemp = a[j]; a[j] = a[j-1]; a[j-1] = temp; flag =true; } if(!flag) return; } }
3. 插入排序
基本思想:假定一个已排好序的序列和一个元素,只需将该元素从序列末尾向前比较,找到第一个小于它的序列元素,排在其之后即可。思想类似于玩扑克牌时整理牌面。
特点:平均时间复杂度O(n^2),最坏时间复杂度O(n^2),额外空间O(1),稳定排序(比较元素和序列时,找到序列中相等元素的话,排在其之后),序列大部分已排好序时(时间复杂度可提升至O(n))较好!
代码:
void insert_sort(int *a, int n) { inttemp; for(inti =2; i <= n; i++) { intj = i - 1; temp = a[i]; while(j >= 1) { if(a[j] > temp) { a[j+1] = a[j]; j--; }else break; } a[j+1] = temp; } }
4. 希尔排序
基本思想:插入排序的升级版(根据其特点:序列大部分已排好序时效率很高),将数据分为不同的组,先对每一组进行排序,然后对所有元素进行一次排序(即最后步长必须为1),步长的选择是递减的,比如5、3、1,现在一般使用D.E.Knuth分组方法(n很大是,用h(n+1)=3h(n)+1来分组,即1、4、13......)。
特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n^s)(1<s<2),额外空间O(1),不稳定排序(相等元素在不同组里,交换后相对顺序可能改变)!
代码:
void shell_sort(int *a, int n) { //我这里步长为5、3、1,仅为举例 for(intgap = 5; gap > 0; gap -= 2) for(inti = gap + 1; i <=n; i++) { intj = i - gap; inttemp = a[i]; while(j >= 1) { if(a[j] > temp) { a[j + gap] = a[j]; j -= gap; }else break; } a[j+gap] = temp; } }
5. 归并排序
基本思想:分治的思想,就是用递归先将序列分解成只剩一个元素的子序列,然后逐渐向上进行合并,每次合并过程就是将两个内部已排序的子序列进行合并排序,只需O(n)时间。
特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n*logn),额外空间O(n)(另外需要一个数组),稳定排序,当n较大时较好(当也不能太大,用了递归就要考虑栈溢出)!
代码:
int b[MAX] = {0}; void merge(int *a,intlow, int mid, inthigh) { inti = low, j = mid + 1;//左边和右边的初始位置 intk = i; while(i <= mid && j <= high) { if(a[i] <= a[j]) { b[k++] = a[i]; i++; }else{ b[k++] = a[j]; j++; } } while(i <= mid){ b[k++] = a[i++]; } while(j <= high){ b[k++] = a[j++]; } for(intx = 1, i = low; x <= high-low+1; x++, i++) a[i] = b[i]; } voidmerge_sort(int*a,int low, int high) { intmid; if(low < high) { mid = (low + high) / 2; merge_sort(a, low, mid); merge_sort(a, mid+1, high); merge(a, low, mid, high); } }
6. 堆排序
基本思想:利用最大堆的性质——父节点拥有最大值,所以不断的将堆的根节点与最后节点交换,减小堆长度,然后再恢复堆性质,堆排序主要就是建立最大堆和不断恢复堆性质两个过程。堆排序不需要用到递归,所以适合海量数据处理,同时堆还可以用于优先级队列。
特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n*logn),额外空间O(1),不稳定排序(涉及根节点与最后节点的交换,可能会破坏两相等元素的相对位置!),当n较大时较好(海量数据)!
代码:
void max_heapify(int *a, int p, int n) { intleft = 2 * p; intright = 2 * p + 1; intlarge = p; if(left <= n && a[left] > a[p]) large = left; if(right <= n && a[right] > a[large]) large = right; if(large != p) { inttemp = a[p]; a[p] = a[large]; a[large] = temp; max_heapify(a, large, n); } } voidheap_sort(int*a,int n) { //build_max_heap for(inti = n/2; i > 0; i--) max_heapify(a, i, n); inttemp; while(n > 1){ temp = a[n]; a[n] = a[1]; a[1] = temp; --n; max_heapify(a, 1, n); } }
7. 快速排序
基本思想:快排是目前使用最多的排序算法,每次都是先选择一个位置的元素(可以为序列的最左或最右位置)作为中间值,将比其小的元素放在其左边,比其大的元素放在右边,然后递归对其左边和右边的子序列进行相同操作,直到子序列为单个元素。
特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n^2)(序列基本有序时,退化为冒泡排序),额外空间O(logn),不稳定排序(举例:序列为 5 3 3 4 3 8 9 10 11, 现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱),当n较大时较好(当也不能太大,用了递归就要考虑栈溢出)!
代码:
void quick_sort(int *a, int p, int r) { if(p < r) { inttemp; intx = a[r]; inti = p - 1; for(intj = p; j < r; j++) if(a[j] < x) { i++; temp = a[j]; a[j] = a[i]; a[i] = temp; } temp = a[i+1]; a[i+1] = a[r]; a[r] = temp; quick_sort(a, p, i); quick_sort(a, i+2, r); } }
8. 计数排序
基本思想:假定输入是有一个小范围内的整数构成的(比如年龄等),利用额外的数组去记录元素应该排列的位置,思想比较简单,看代码即可了解。
特点:在一定限制下时间复杂度为O(n),额外空间O(n)(需要两个数组),稳定排序!
代码:
int b[MAX] = {0}; int c[MAX] = {0}; void counting_sort(int *a, int n) { for(inti=1; i <= n; i++) c[a[i]]++; //c[i]包含等于i的元素个数 for(inti=1; i < MAX; i++) c[i] += c[i-1];//c[i]包含小于等于i的元素个数 for(inti = n; i>0; i--){ b[c[a[i]]] = a[i]; c[a[i]]--; } for(inti = 1; i <=n; i++) a[i] = b[i]; }
9. 基数排序
基本思想:只适用于整数排序,确定序列中元素的最大位数d,只要进行d次循环,从低位开始根据相应位置的数进行排序。(我的代码中具体排序是参考了计数排序,数据结构中还可以用链式相关的方法)。
特点:在一定限制下时间复杂度为O(n),额外空间O(n)(需要两个数组),稳定排序!
代码:
int b[MAX] = {0}; int counter[10] = {0}; int get_value(int v, int d) //获取第d位上的值 { for(inti = 1; i < d; i++) v = v/10; returnv%10; } //只能排序d位的十进制数 voidradix_sort(int*a,int n, int d) { intx; for(intk = 1; k <= d; k++) { for(inti = 0; i < 10; i++) counter[i] = 0;//注意,一定要清零 for(inti = 1; i <= n; i++) { x = get_value(a[i], k); counter[x]++; } for(inti = 1; i < 10; i++) counter[i] += counter[i-1]; for(inti = n; i > 0; i--) { x = get_value(a[i], k); b[counter[x]] = a[i]; counter[x]--; } for(inti = 1; i <= n; i++) a[i] = b[i]; } }
排序总结
稳定性:选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,而冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。
快速排序算法使用最广泛,大数据量时适合使用快速排序、归并排序和堆排序,需要O(n)时间复杂度时(当然要考虑数值范围的限制),可以考虑使用计数排序、基数排序、桶排序(上面未介绍,思想很简单,假设数据分布均匀!)等。
最后是我用来测试排序算法的main函数,非常简单!
#include <iostream> usingnamespacestd; constintMAX = 255; int main () { intn; inta[MAX]; cin >> n; for(inti = 1; i <= n; i++) cin >> a[i]; cout <<"Before sort:"; for(inti = 1; i <= n; i++) cout << a[i] <<" "; cout << endl; //radix_sort(a, n, 2); //select_sort(a, n); //insert_sort(a, n); //bubble_sort(a, n); //quick_sort(a, 1, n); //heap_sort(a, n); //merge_sort(a, 1, n); //counting_sort(a, n); //shell_sort(a, n); cout <<"Sort:"; for(inti = 1; i <= n; i++) cout << a[i] <<" "; cout << endl; return0; }
排序算法基本上就总结如上,告诫自己,不能死记硬背!要理解思想,同时要注意实现上的一些技巧!