python之生成器

生成器的作用

通过列表⽣成式,我们可以直接创建⼀个列表。但是,受到内存限制,列表容量肯定是有限的。⽽且,创建⼀个包含100万个元素的列表,不仅占⽤很⼤的存储空间,如果我们仅仅需要访问前⾯⼏个元素,那后⾯绝⼤多数元素占⽤的空间都⽩⽩浪费了。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从⽽节省⼤量的空间。在Python中,这种⼀边循环⼀边计算的机制,称为⽣成器:generator。
创建生成器,列表生成式,我们知道,只要将最外一层的中括号,改为小括号。

>>> # python交互式环境
>>> y = [x + 1 for x in range(10) if x % 2 == 0]
>>> y [1, 3, 5, 7, 9]
>>> g = (x + 1 for x in range(10) if x % 2 == 0)
>>> g <generator object <genexpr> at 0x0000020EF13E79C8>

创建 y 和 g 的区别仅在于最外层的 [ ] 和 ( ) , y 是⼀个列表,⽽ g 是⼀个⽣成器。我们可以直接打印出L的每⼀个元素,但我们怎么打印出g的每⼀个元素呢?如果要⼀个⼀个打印出来,可以通过 next() 函数获得⽣成器的下⼀个返回值:

>>> next(g)
1
>>> next(g)
3
>>> next(g)
5
>>> next(g)
7
>>> next(g)
9
>>> next(g)
Traceback (most recent call last):
  File "<pyshell#13>", line 1, in <module>
	next(g)
  StopIteration

也可以通过循环打印出来

>>> g = (x + 1 for x in range(10) if x % 2 == 0)
>>> for i in g:
        print(i)
        ...
1
3
5
7
9

⽣成器保存的是算法,每次调⽤ next(g) ,就计算出 g 的下⼀个元素的值,直到计算到最后⼀个元素,没有更多的元素时,抛出 StopIteration 的异常。当然,这种不断调⽤ next() 实在是太繁琐了,虽然是点一次出现一次,但正确的⽅法是使⽤ for 循环,因为⽣成器也是可迭代对象。所以,我们创建了⼀个⽣成器后,基本上永远不会调⽤next() ,⽽是通过 for 循环来迭代它,并且不需要关心StopIteration 异常。所以,我们创建了一个生成器后,基本上不会调用 next() ,而是通过 for 循环来迭代它,并且不需要关心StopIteration 的错误。generator非常强大。如果推算的算法比较复杂,用类似列表生成式的 for 循环无法实现的时候,还可以用函数来实现。比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:1, 1, 2, 3, 5, 8, 13, 21, 34, ...斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
代码如下:

def fib_a(times):
    # 初始化
    n = 0
    a, b = 0, 1
    while n < times:
        print(b)
        a, b = b, a + b
        n += 1
    return 'done'

z = fib_a(5)
print(z)

# 打印结果:
1
1
2
3
5
done

仔细观察,可以看出,fib_a函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。也就是说,上面的函数和generator仅一步之遥。要把 fib 函数变成generator,只需要把 print(b) 改为 yield(b) 就可以了:

def fib_a(times):
    # 初始化
    n = 0
    a, b = 0, 1
    while n < times:
        yield(b)
        a, b = b, a + b
        n += 1
    return 'done'

在上⾯fib 的例⼦,我们在循环过程中不断调⽤ yield ,就会不断中断。当然要给循环设置⼀个条件来退出循环,不然就会产⽣⼀个⽆限数列出来。同样的,把函数改成generator后,我们基本上从来不会⽤ next() 来获取下⼀个返回值,⽽是直接使⽤ for 循环来迭代:

for i in fib_a(5):
    print(i)
1
1
2
3
5

但是⽤for循环调⽤generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中

⽣成器是这样⼀个函数,它记住上⼀次返回时在函数体中的位置。对⽣成器函数的第⼆次(或第 n 次)调⽤跳转⾄该函数中间,⽽上次调⽤的所有局部变量都保持不变。⽣成器不仅“记住”了它数据状态;⽣成器还“记住”了它在流程控制构造(在命令式编程中,这种构造不只是数据值)中的位置。
⽣成器的特点:

  1. 节约内存
  2. 迭代到下⼀次的调⽤时,所使⽤的参数都是第⼀次所保留下的,在整个所有函数调⽤的参数都是第⼀次所调⽤时保 留的,⽽不是新创建的。
上一篇:你一定要知道的iterator和generator


下一篇:Reporting Services无法连接ORACLE,提示:System.Data.OracleClient 需要 Oracle 客户端软件 8.1.7 或更高版本