《编程珠玑》中习题1.4的题目是:“如果认真考虑了习题3,你将会面对生成小于n且没有重复的k个整数的问题。最简单的方法就是使用前k个正整数。这个极端的数据集合将不会明显的改变位图方法的运行时间,但是可能会歪曲系统排序的运行时间。如何生成位于0至n - 1之间的k个不同的随机顺序的随机整数?尽量使你的程序简短高效。”
解决这个问题可以使用以空间换时间的方式,基本的思想是 利用洗牌的原理,将n个数(0至n-1)按次序排好,依次让每个数和一个随机挑选出的位子进行互换,这样肯定不会重复,而且次序被打乱,具有随性。 只用交换k次,就可以取出k个小于n的互不相同的随机数。
由这个问题我们引出以下这个笔试题目的问题:
“使用一个长度为n的数组来产生随机数,当产生的随机数与数组的存在的相同则重新随机,当不同时插入到数组中,使用这种方法产生1到n的随机数的期望次数是多少次?(编程实现)”
解答:
一般的思想是产生一个随机数 arr[i] 后,和前面已经产生的arr[0]~arr[i-1]进行比较,如果有重复的就重新产生一个,该算法的平均时间复杂度为:O(n^2) ,而最坏复杂度为无限!!
这里我们按照编程珠玑上那个问题的扩展想法,利用空间换时间的算法,生成随机排列的数,此时时间复杂度为O(n)。
(1)建立一个长度为n+1的临时数组b,对该数组赋值依次赋值0~n, 即b[i] = i;
(2)取一个1~n之间的随机整数k=rand(0,n],取b[k]读入arr[i],再将b数组最后一个元素b[b.size-1]赋值给b[k],将b的长度减1;
代码实现:
/* *BLOG:http://blog.csdn.net/wdzxl198 *AUTHOR:Atlas *EMAIL:wdzxl198@163.com */ #include<iostream> using namespace std; void Random(int *arr,int length) { srand(time(NULL)); int i,randnum; int limitsize = length; int b[limitsize]; for(i=0; i<limitsize; i++) { b[i] = i+1; } for(i=0; i<length; i++) { randnum = rand()%limitsize; limitsize--; arr[i] = b[randnum]; b[randnum] = b[limitsize]; } } int main() { int arr[100]; //假使随机出1到100的随机数 Random(arr,100); for(int i=0;i<100;i++) { cout<<arr[i]<<" "; } cout<<endl; quickSort(arr,0,99); for(int i=0;i<100;i++) { cout<<arr[i]<<" "; } cout<<endl; system("PAUSE"); return 0; }这种方法的是O(n)时间复杂度,但是没有求出题目中期望的次数。
在求期望的过程中,我发现一篇博文,题目是有一个数组,每次从中间随机取一个,然后放回去,当所有的元素都被取过,返回总共的取的次数。写一个函数实现。复杂度是什么。,这个题目与文章中的类似,转载过来分析下,
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * #面试题#有一个数组,每次从中间随机取一个,然后放回去,当所有的元素都被取过,返回总共的取的次数。 * 写一个函数实现。复杂度是什么。 * bitmap,只要一个bit就可以标记是否被取过,可参考《编程珠玑》的位图排序 * * 时间复杂度的话,我不太会算,以下是引用https://github.com/vyan/test/blob/master/accessTimes.cpp: * 使用bit打点记录已经取的数, * 复杂度分析,假设数组总长度为n * 取到第1个之前未被取到的数的期望 E(1)=1 * 取到第2个之前未被取到的数的期望 E(2)=n/n-1 * 取到第3个之前未被取到的数的期望 E(3)=n/n-2 * ... * 取到第n个之前未被取到的数的期望 E(n)=n/1 * 总得期望次数E=n+n/(n-1)+n/(n-2)+...+n/1; * =n(1+1/(n-1)+1/(n-2)+...+1/1) * =nln(n) * 所以算法平均复杂度为nlogn * * 下面的代码里面,除法和求模运算我都用位运算来实现,事实上直接用java提供的(/,%)也可以 * 同时,为了验证是否真的取到了数组的所有元素,我用了TreeSet保存已选中的下标(去重) * * 最后,还有一个问题是,可能取了很多次,都没能全选中,这个时候可以设置一个最长时间或者最大尝试次数,超过则结束程序, * 避免程序长时间运行甚至死循环 * * @author lijinnan * */ public class TimesOfAccessArray { public static final int SHIFT = 5; public static final int BLOCK_SIZE = (1 << SHIFT); //32 public static final int MASK = (1 << SHIFT) - 1; //31 public static void main(String[] args) { int[] array = new int[200]; long times = accessTimes(array); System.out.println(times); } public static long accessTimes(int[] array) { if (array == null || array.length == 0) { return -1L; } long result = 0L; int len = array.length; int[] bitmap = new int[divide(len, BLOCK_SIZE) + 1]; int setTimes = 0; Set<Integer> set = new TreeSet<Integer>(); while (setTimes < len) { int pos = new Random().nextInt(len); set.add(pos); if (set(bitmap, pos)) { setTimes++; } result++; } System.out.println(set); return result; } public static boolean set(int[] bitmap, int pos) { boolean result = false; int blockNo = divide(pos, BLOCK_SIZE); int index = mod(pos, BLOCK_SIZE); boolean notExist = (bitmap[blockNo] & (1 << index))== 0; if (notExist) { bitmap[blockNo] |= (1 << index); result = true; } return result; } public static boolean exist(int[] bitmap, int pos) { int blockNo = divide(pos, BLOCK_SIZE); int index = mod(pos, BLOCK_SIZE); return (bitmap[blockNo] & (1 << index)) != 0; } private static int divide(int x, int y) { return x >> offSet(y); } private static int mod(int x, int y) { int z = x; int i = offSet(y); return z - ((z >> i) << i); } //e.g. 32=2^5, return 5 只考虑2的幂 private static int offSet(int y) { return howManyBits(y) - 1; } //二进制的表示里面,有多少位。例如32是6位 private static int howManyBits(int y) { int bitNum = 0; while (y != 0) { y = (y >> 1); bitNum++; } return bitNum; } }