(算法)等概率选出m个整数

题目:

从大小为n的整数数组A中随机选出m个整数,要求每个元素被选中的概率相同。

思路:

n选m,等概率情况下,每个数被选中的概率为m/n。

方法:

初始化:从A中选择前m个元素作为初始数组;

随机选择:从第m个元素开始,依次遍历数组下标i,并通过随机生成器生成数字k(生成0~n),如果k<m,则将A[i]替换A[k]。

证明:

归纳法:假设数组A大小为n,需要选m个元素,每个元素被选中的概率为m/n。

对于初始化的m个元素而言,其选中的概率自然为m/n;

而对于第n+1个元素,该元素被选中的概率m/(n+1)(根据随机生成器),

而对于此时前m个元素,根据第n+1个元素的选中与否情况:

第n+1个没选中的概率为1-m/(n+1),则全部留下的可能性为P1:m/n*(1-m/n+1),

第n+1个被选中的概率为m/(n+1)有一个被替换后留下的可能性为P2:m/n*m/(n+1)*(m-1)/m,

总的留下概率为:P1+P2=m/(n+1)

因此得证。

代码:

#include<iostream>
#include<stdlib.h>
#include<time.h>
#include<vector> using namespace std; void pickM(const vector<int> &A,int m,vector<int> &pick){
int n=A.size(); for(int i=;i<m;i++){
pick.push_back(A[i]);
} srand((unsigned)time());
for(int i=m;i<n;i++){
int k=rand()%n;
if(k<m)
pick[k]=A[i];
}
} int main(){
int m,n;
while(cin>>n>>m){
vector<int> A(n);
for(int i=;i<n;i++)
cin>>A[i]; vector<int> pick;
pickM(A,m,pick); for(int i=;i<m;i++)
cout<<pick[i]<<" ";
cout<<endl;
}
return ;
}
上一篇:CSS——对height和line-height的理解


下一篇:Analyze network packet files very carefully