python – 不将可迭代(itertools.combinations)转换为列表的混洗组合

以下简单代码为我提供了200个元素的长度3的可能组合.

from itertools import combinations
comb = combinations( range(200), 3 )

我想以随机顺序获取组合以选择前N个组合.但是,如果我将梳子转换为列表并将其随机播放,我可能会收到内存错误,因为列表可能包含太多元素:

comb = list(comb) # This might be huge and give a memory error 
random.shuffle(comb)
N = 10
comb = comb[:10] # get only the first N random combinations

有没有其他方法可以获得N个随机组合? (即,不按itertools.combinations生成的顺序).

解决方法:

有C(200,3)= 1313400种可能的组合.正如您所提到的,由于combinatorial explosion,这个数字很容易失控.例如,如果您选择4而不是3个元素,则组合数量将大约为50倍(64684950).您可以随机构建可能的组合,而不是从这些组合中随机选择.

要构建这些组合,可以使用随机库中的random.sample. random.sample(range(200),3)将随机生成这些1313400组合中的一个.如果再次调用它,它将生成另一个组合.

有两个问题:

>顺序在random.sample中很重要([1,2,3]不同于[1,3,2]).在组合中,它不是.要解决这个问题,您可以使用sorted().
> random.sample将独立生成接下来的3个数字.因此,在不同迭代中生成的组合可以是相同的.虽然此示例(≈0.0000343)不太可能,但您可以使用一组来存储组合,以便只存储唯一的组合.

以下将生成10种不同的组合:

import random
combs = set()
N = 10
while len(combs) < N:
    combs.add(tuple(sorted(random.sample(range(200), 3))))
上一篇:python – 无需替换的内存高效随机数迭代器


下一篇:python – 来自右侧的islice