这一节来学习生成器(generator)和迭代器(iterator)
首先来回忆一个例子,这里打印rest的时候为什么要通过list(rest)打出,而不是直接输出rest?
1
2
3
4
5
|
>>> li = [ 11 , 22 , 33 ]
rest = filter ( lambda x:x> 22 ,li)
print ( list (rest))
- - - - - - - -
[ 33 ]
|
试试看,如果直接输出是什么结果?
1
2
3
4
|
>>> li = [ 11 , 22 , 33 ]
rest = filter ( lambda x:x> 22 ,li)
print (rest)
< filter object at 0x00000192C88AF4A8 >
|
事实上,如果在2.7里面,他会直接输出结果,但是在3.X以后,他只会返回一个具有生成能力的对象,而不是直接输出所有结果,这样的好处是如果我们有成千上万个数据要输出,他不会直接一股脑的就输出来了。我们需要循环地输出这个对象生成所有需要的值。比如把上面的例子改成for循环也是一样的
1
2
3
4
5
|
>>> li = [ 11 , 22 , 33 ]
rest = filter ( lambda x:x> 22 ,li)
for i in rest:
print (i)
33 |
现在来看看基本的定义:
1.迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。另外,迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件
特点:
-
访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
-
不能随机访问集合中的某个值 ,只能从头到尾依次访问
-
访问到一半时不能往回退
-
便于循环比较大的数据集合,节省内存
2. 一个函数调用时返回一个迭代器,那这个函数就叫做生成器(generator);如果函数中包含yield语法,那这个函数就会变成生成器;
下面直接通过例子说明:
比如我定义了一个函数f1,里面包含了yield这个关键字,那么他就变成了一个生成器,他的结果只能通过迭代器的next方法一步步输出
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
>>> def f1():
print ( "1" )
yield 22
print ( "2" )
yield 33
print ( "3" )
yield 44
r = f1()
print (r, type (r))
print (r.__next__())
print (r.__next__())
print (r.__next__())
- - - - - - - - - - - - - - - - - - - -
<generator object f1 at 0x00000192C88DC728 > < class 'generator' >
1 22 2 33 3 |
当然通过循环语句自动调用迭代器更方便了
1
2
|
for item in r:
print (item)
|
例2 通过生成器做一个range的函数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
>>> def nrange(num):
temp = - 1
while True :
temp = temp + 1
if temp > = num:
return
else :
yield temp
r = nrange( 5 )
print (r)
for item in r:
print (item)
- - - - - - - - - - - - - - - - - - - - -
<generator object nrange at 0x00000192C88DC360 >
0 1 2 3 4 |
再看个例子
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
def split_line():
print ( 'ready to split' )
result = "4 5 6"
while True :
line = yield result
result = line.split()
s = split_line()
s.__next__() #send的值去替换掉line的值,返回值是result ret = s.send( '1 2 3' )
print (ret)
ret = s.send( 'a b c' )
print (ret)
"C:\Program Files\Python3\python.exe" C: / Users / yli / pycharmprojects / Exercise / Week12 / test.py
ready to split - - - - - - - - - -
[ '1' , '2' , '3' ]
[ 'a' , 'b' , 'c' ]
|