1、排序后去出前k个,o(n*log(n)) 如果k<log(n),可以考虑直接选择排序,因为只需要执行找到第k个就可以结束 o(n*k)
2、o(nlog(k))快排把数分为了两个部分,所以考虑两个情况,如果大的部分的个数>k,说明只要继续在大的部分找就可以了,
如果大的部分的个数<k,先把这些数取了,然后继续在小的部分里面找剩下的数(k-大的部分的个数)就可以了。
3、o(nlog((maxv-minv)/delta)),平均为o(nlogn) 转化为找第k个, 假设最大的数为maxv,最小的为minv,那么第k个数必然在[minv,maxv]这个区间中,每次二分这个区间,设mid的数为s,看数组a中比s大的数有没有k大来调整二分,就最后可以得到了。
如果文件太大,每次统计midv的个数都需要读一次文件,完成一个循环后,把新的区间存入一个新的文件,然后直到新的文件可以放入内存。
while(maxv- minv > delta)
{
midv = minv + (maxv - minv)*0.5;
if(f(a,N,midv) >= k) minv = midv;
else maxv = midv;
} f(a,N,midv)是找出a数组中比midv大的数的个数
4、维护一个k个数的小顶堆,遍历数组a,然后每次更新小顶堆即可 o(nlog(k)) 实际就是堆排序
if(x > h[])
{
h[] = x;
p,q;
p = ;
while(p < k)
{
q = *p + ;
if(q >= k )break; if( (q<k-) && (h[q+] < h[q]) ) q = q + ; if(h[q] < h[p])
{
swap(h[q],h[p]);
p = q;
}
else break;
}
}
如果k太大不能一次装入内存k个数的堆,那么选一个可以装入内存的数s,第一次找s个,然后找s个。。。直到s*i >k即可。。。但这样要读的数组a的次数就必须增加了。