链接:https://www.jianshu.com/p/a43b0e1712d1
第k小算法
我们通常会简单地进行一个快速排序后,得到第k个位置上的数字即可。
我们都知道的是快速排序是个不稳定的排序,它的排序过程简单的理解主要是两个概念Partion,pivot(基准数)
一趟快速排序的过程如下
- 先从序列中选取一个数作为基准数
- 将比这个数大的数全部放到它的右边,把小于或者等于它的数全部放到它的左边
一趟快速排序也叫做Partion,即将序列划分为两部分,一部分比基准数小,另一部分比基准数大,然后
再进行分治过程,因为每一次Partion不一定都能保证划分得很均匀,所以最坏情况下的时间复杂度不能
保证总是O(nlogn)的。
BFPRT算法
在BFPTR算法中,仅仅是改变了快速排序Partion中的pivot值的选取,在快速排序中,我们始终选择第一个元
素或者最后一个元素作为pivot,而在BFPTR算法中,每次选择五分中位数的中位数作为pivot,这样做的目的
就是使得划分比较合理,从而避免了最坏情况的发生。算法步骤如下
(1)将输入数组的n个元素划分为n/5组,每组5个元素,且至多只有一个组由剩下的n%5个元素组成。
(2)寻找n/5个组中每一个组的中位数,首先对每组的元素进行插入排序,然后从排序过的序列中选出中位数。
(3)对于(2)中找出的n/5个中位数,递归进行步骤(1)和(2),直到只剩下一个数即为这n/5个元素的中位数,找到中位数后并找到对应的下标p。
(4)进行Partion划分过程,Partion划分中的pivot元素下标为p。
(5)进行高低区判断即可。
本算法的最坏时间复杂度为O(n),值得注意的是通过BFPTR算法将数组按第K小(大)的元素划分为两部分,而
这高低两部分不一定是有序的,通常我们也不需要求出顺序,而只需要求出前K大的或者前K小的。
#include <stdio.h> #include <algorithm> #include <iostream> #include <stdbool.h> #include <stdlib.h> #include <string> #include <string.h> #include <math.h> #include <vector> #include <queue> #include <stack> #include <set> #include <map> #define INF 0x3f3f3f3f #define LL long long #define MAXN 1000010 using namespace std; const int N = 1000005; int a[N]; int findMedian(int a[] , int l , int r) { int i , index; for(i=l,index=0 ; i+4<=r ; i+=5,index++){ sort(a+l , a+l+5); swap(a[l+index] , a[i+2]); } if(i<=r){ sort(a+i , a+r+1); swap(a[l+index] , a[i+(r-i+1)/2]); index++; } if(index == 1) return a[l]; else return findMedian(a , l , l+index-1); } //以p位置上的数字作为基准点划分,返回的i是最后基准点所在的位置 int partion(int a[] , int l , int r , int p) { swap(a[p] , a[l]); int i=l , j=r , pivot= a[i]; while(i<j){ while(i<j && a[j]>=pivot) j--; if(i<j) a[i] = a[j]; while(i<j && a[i]<=pivot) i++; if(i<j) a[j] = a[i]; } a[i] = pivot; return i; } //在a数组的[l,r]区间内找到第k小的数字,k从1开始 int findKthMin(int a[] , int l , int r , int k) { int median = findMedian(a , l , r); int p = partion(a , l , r , l); int len = p-l+1; if(len == k) return a[p]; else if(len>k) return findKthMin(a,l,p-1,k); else return findKthMin(a,p+1,r,k-len); } int main() { int n, k; while(~scanf("%d", &n)){ scanf("%d", &k); for(int i = 0; i < n; i++) scanf("%d", &a[i]); int ret = findKthMin(a,0,n-1,k); //for(int i=0 ; i<n ; i++) printf("%d\n", ret); } return 0; }
其实BFPRT的partion部分和快排的patition方法是差不多的。只是基准点的选取不一样罢了