python-itertools.product是否懒惰地评估其参数?

以下内容在Python 3.6中从不打印任何内容

from itertools import product, count

for f in product(count(), [1,2]): 
    print(f)

相反,它只是坐在那里烧坏了CPU.问题似乎在于,如果产品在无限空间内,则它永远不会返回迭代器,因为它首先评估完整产品.考虑到该产品应该是发电机,这是令人惊讶的.

我本来希望这会开始计数(到无穷大),类似于此生成器的行为(取值为directly from the docs):

for tup in ((x,y) for x in count() for y in [1,2]):
    print(tup)

但是,尽管我的生成器立即开始计数,但使用产品的生成器却从未计数.

itertools中的其他工具可以达到我的期望.例如,以下内容:

for f in takewhile(lambda x: True, count()): 
    print(f)

会打印数字流,因为takewhile很懒.

解决方法:

itertools.product懒惰地生成其结果,但是对于参数而言并非如此.他们受到热切评价.每个可迭代的参数都首先转换为元组:

参数的评估(而不是结果的产生)与文档中显示的Python实现非常相似:

...
pools = [tuple(pool) for pool in args] * repeat

而在CPython implementation中,池是元组的元组:

for (i=0; i < nargs ; ++i) {
     PyObject *item = PyTuple_GET_ITEM(args, i);
     PyObject *pool = PySequence_Tuple(item);   /* here */
     if (pool == NULL)
         goto error;
     PyTuple_SET_ITEM(pools, i, pool);
     indices[i] = 0;
 }

之所以如此,是因为产品有时需要遍历一次以上的迭代,而如果将参数作为只能使用一次的迭代器保留,则这是不可能的.

实际上,您无法从itertools.count对象构建元组.在传递给产品之前,请考虑使用itertools.islice切片至合理的长度.

上一篇:python – 检查两个嵌套列表在替换时是否相同


下一篇:在python中串联多个列表