[转]python yield

  

任何使用yield的函数都称之为生成器,如:

  1. def count(n):
  2. while n > 0:
  3. yield n   #生成值:n
  4. n -= 1

另外一种说法:生成器就是一个返回迭代器的函数,与普通函数的区别是生成器包含yield语句,更简单点理解生成器就是一个迭代器。

使用yield,可以让函数生成一个序列,该函数返回的对象类型是"generator",通过该对象连续调用next()方法返回序列值。

  1. c = count(5)
  2. c.next()
  3. >>> 5
  4. c.next()
  5. >>>4

生成器函数只有在调用next()方法的时候才开始执行函数里面的语句,比如:

  1. def count(n):
  2. print "cunting"
  3. while n > 0:
  4. yield n   #生成值:n
  5. n -= 1

在调用count函数时:c=count(5),并不会打印"counting"只有等到调用c.next()时才真正执行里面的语句。每次调用next()方法时,count函数会运行到语句yield n处为止,next()的返回值就是生成值n,再次调用next()方法时,函数继续执行yield之后的语句(熟悉Java的朋友肯定知道Thread.yield()方法,作用是暂停当前线程的运行,让其他线程执行),如:

  1. def count(n):
  2. print "cunting"
  3. while n > 0:
  4. print 'before yield'
  5. yield n   #生成值:n
  6. n -= 1
  7. print 'after yield'

上述代码在第一次调用next方法时,并不会打印"after yield"。如果一直调用next方法,当执行到没有可迭代的值后,程序就会报错:

Traceback (most recent call last): File "", line 1, in StopIteration

所以一般不会手动的调用next方法,而使用for循环:

  1. for i in count(5):
  2. print i,

实例: 用yield生成器模拟Linux中命令:tail -f | grep python 用于查找监控日志文件中出现有python字样的行。

  1. import time
  2. def tail(f):
  3. f.seek(0,2)#移动到文件EOF,参考:[seek](http://docs.python.org/2/library/stdtypes.html?highlight=file#file.seek)
  4. while True:
  5. line = f.readline()  #读取文件中新的文本行
  6. if not line:
  7. time.sleep(0.1)
  8. continue
  9. yield line
  10. def grep(lines,searchtext):
  11. for line in lines:
  12. if searchtext in line:
  13. yield line

调用:

  1. flog = tail(open('warn.log'))
  2. pylines = grep(flog,'python')
  3. for line in pylines:
  4. print line,

用yield实现斐波那契数列:

  1. def fibonacci():
  2. a=b=1
  3. yield a
  4. yield b
  5. while True:
  6. a,b = b,a+b
  7. yield b

调用:

  1. for num in fibonacci():
  2. if num > 100:
  3. break
  4. print num,

yield中return的作用:
作为生成器,因为每次迭代就会返回一个值,所以不能显示的在生成器函数中return 某个值,包括None值也不行,否则会抛出“SyntaxError”的异常,但是在函数中可以出现单独的return,表示结束该语句。
通过固定长度的缓冲区不断读文件,防止一次性读取出现内存溢出的例子:

  1. def read_file(path):
  2. size = 1024
  3. with open(path,'r') as f:
  4. while True:
  5. block = f.read(SIZE)
  6. if block:
  7. yield block
  8. else:
  9. return

如果是在函数中return 具体某个值,就直接抛异常了

  1. >>> def test_return():
  2. ...      yield 4
  3. ...      return 0
  4. ...
  5. File "<stdin>", line 3
  6. SyntaxError: 'return' with argument inside generator

原文地址:http://liuzhijun.iteye.com/blog/1852369#comments

上一篇:关于这种取值的问题 【原创】


下一篇:Python 10min系列之面试题解析丨Python实现tail -f功能