BFPRT算法O(n)解决第k小的数

链接:https://www.jianshu.com/p/a43b0e1712d1

第k小算法

我们通常会简单地进行一个快速排序后,得到第k个位置上的数字即可。
我们都知道的是快速排序是个不稳定的排序,它的排序过程简单的理解主要是两个概念Partion,pivot(基准数)

一趟快速排序的过程如下

  1. 先从序列中选取一个数作为基准数
  2. 将比这个数大的数全部放到它的右边,把小于或者等于它的数全部放到它的左边

一趟快速排序也叫做Partion,即将序列划分为两部分,一部分比基准数小,另一部分比基准数大,然后
再进行分治过程,因为每一次Partion不一定都能保证划分得很均匀,所以最坏情况下的时间复杂度不能
保证总是O(nlogn)的。

BFPRT算法

BFPTR算法中,仅仅是改变了快速排序Partion中的pivot值的选取,在快速排序中,我们始终选择第一个元
素或者最后一个元素作为pivot,而在BFPTR算法中,每次选择五分中位数的中位数作为pivot,这样做的目的
就是使得划分比较合理,从而避免了最坏情况的发生。算法步骤如下

(1)将输入数组的n个元素划分为n/5组,每组5个元素,且至多只有一个组由剩下的n%5个元素组成。
(2)寻找n/5个组中每一个组的中位数,首先对每组的元素进行插入排序,然后从排序过的序列中选出中位数。
(3)对于(2)中找出的n/5个中位数,递归进行步骤(1)和(2),直到只剩下一个数即为这n/5个元素的中位数,找到中位数后并找到对应的下标p。
(4)进行Partion划分过程,Partion划分中的pivot元素下标为p。
(5)进行高低区判断即可。

本算法的最坏时间复杂度为O(n),值得注意的是通过BFPTR算法将数组按第K小(大)的元素划分为两部分,而
这高低两部分不一定是有序的,通常我们也不需要求出顺序,而只需要求出前K大的或者前K小的。

 

#include <stdio.h>
#include <algorithm>
#include <iostream>
#include <stdbool.h>
#include <stdlib.h>
#include <string>
#include <string.h>
#include <math.h>
#include <vector>
#include <queue>
#include <stack>
#include <set>
#include <map>

#define INF 0x3f3f3f3f
#define LL long long
#define MAXN 1000010
using namespace std;

const int N = 1000005;

int a[N];


int findMedian(int a[] , int l , int r)
{
    int i , index;
    for(i=l,index=0 ; i+4<=r ; i+=5,index++){
        sort(a+l , a+l+5);
        swap(a[l+index] , a[i+2]);
    }
    if(i<=r){
        sort(a+i , a+r+1);
        swap(a[l+index] , a[i+(r-i+1)/2]);
        index++;
    }
    if(index == 1) return a[l];
    else return findMedian(a , l , l+index-1);
}
//以p位置上的数字作为基准点划分,返回的i是最后基准点所在的位置
int partion(int a[] , int l , int r , int p)
{
    swap(a[p] , a[l]);
    int i=l , j=r , pivot= a[i];
    while(i<j){
        while(i<j && a[j]>=pivot) j--;
        if(i<j) a[i] = a[j];
        while(i<j && a[i]<=pivot) i++;
        if(i<j) a[j] = a[i];
    }
    a[i] = pivot;
    return i;
}
//在a数组的[l,r]区间内找到第k小的数字,k从1开始
int findKthMin(int a[] , int l , int r , int k)
{
    int median = findMedian(a , l , r);
    int p = partion(a , l , r , l);
    int len = p-l+1;
    if(len == k) return a[p];
    else if(len>k) return findKthMin(a,l,p-1,k);
    else return findKthMin(a,p+1,r,k-len);
}

int main()
{
    int n, k;
    while(~scanf("%d", &n)){
        scanf("%d", &k);
        for(int i = 0; i < n; i++)
            scanf("%d", &a[i]);
        int ret = findKthMin(a,0,n-1,k);
        //for(int i=0 ; i<n ; i++)
        printf("%d\n", ret);
    }
    return 0;
}

 

 

其实BFPRT的partion部分和快排的patition方法是差不多的。只是基准点的选取不一样罢了





上一篇:03.安装jdk8作为系统环境


下一篇:df.melt() df.pivot()