一、初识生成器:
生成器就是自己用Python代码写的迭代器,生成器的本质就是迭代器。
1、Python中提供的生成器:
1、生成器函数:
使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行。
2、生成器表达式:
类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表。
2、生成器Generator:
本质:迭代器(所以自带了__iter__方法和__next__方法,不需要我们去实现)
热点:惰性运算,开发者自定义
二、生成器函数:
一个包含yield关键字的函数就是一个生成器函数。yield可以为我们从函数中返回值,但是yield又不同于return。
yield和return的区别:
return:结束函数,给函数的执行者返回值。
yield:不会结束函数,一个next对应一个yield,给 生成器对象.__next__() 返回值
生成器函数vs迭代器:
1.自定制取值:
只能一个一个取值:
l1 = [1,2,3,4,5]
l1.__iter__() 可以自定义取值:
def func1(x):
x += 1
yield x
x += 3
yield x
x += 5
yield x
g1 = func1(5)
print(g1.__next__())
print(g1.__next__())
print(g1.__next__())
自定制的区别
2、内存级别的区别:
迭代器是需要可迭代对象进行转换,可迭代对象非常占内存。
生成器直接创建,不需要转化,从本质就节省内存。
def func1():
for i in range(1000000):
yield i
g1 = func1()
for i in range(50):
print(g1.__next__())
生成器按需取值
import time
def genrator_fun1():
a = 1
print('现在定义了a变量')
yield a
b = 2
print('现在又定义了b变量')
yield b g1 = genrator_fun1()
print('g1 : ',g1) #打印g1可以发现g1就是一个生成器
print('-'*20) #我是华丽的分割线
print(next(g1))
time.sleep(1) #sleep一秒看清执行过程
print(next(g1)) 初识生成器函数
初始生成器函数
生成器有什么好处呢?就是不会一下子在内存中生成太多数据
假如我想让工厂给学生做校服,生产2000000件衣服,我和工厂一说,工厂应该是先答应下来,然后再去生产,我可以一件一件的要,也可以根据学生一批一批的找工厂拿。
而不能是一说要生产2000000件衣服,工厂就先去做生产2000000件衣服,等回来做好了,学生都毕业了。。。
def produce():
"""生产衣服"""
for i in range(2000000):
yield "生产了第%s件衣服"%i product_g = produce()
print(product_g.__next__()) #要一件衣服
print(product_g.__next__()) #再要一件衣服
print(product_g.__next__()) #再要一件衣服
num = 0
for i in product_g: #要一批衣服,比如5件
print(i)
num +=1
if num == 5:
break
生成器按需取值
三、send
send和next一样,也是对生成器取值(执行一个yield)的方法。
send可以给上一个yield传值。
第一次取值永远都是next。
最后一个yield永远也得不到send传的值。
def generator():
print(123)
content = yield 1
print('=======',content)
print(456)
yield2 g = generator()
ret = g.__next__()
print('***',ret)
ret = g.send('hello') #send的效果和next一样
print('***',ret)
send的用法
四、列表推导式和生成器表达式
1.把列表解析的[]换成()得到的就是生成器表达式
2.列表解析与生成器表达式都是一种便利的编程方式,只不过生成器表达式更节省内存
3.Python不但使用迭代器协议,让for循环变得更加通用。大部分内置函数,也是使用迭代器协议访问对象的。
一、列表推导式:一行代码几乎搞定你需要的任何的列表
优点:一行解决,方便。
缺点:容易着迷,不易排错,不能超过三次循环。
列表推导式不能解决所有列表的问题,所以不要太刻意用。
1、循环模式:[ 变量(加工后的变量) for 变量 in 可迭代对象 ]
prite([ i for i in range(1,101)]) # 循环打印1~100
prite([ ‘Python第%s期’ % i for i in range(1,16)])
2、筛选模式:[ 变量(加工后的变量)for 变量 in 可迭代对象 if 条件 ]
prite([ i for i in range(1,31) if i % 3 == 0 ]) #打印30以内能被3整除的数
prite([ i ** 2 for i in range(1,31) if i % 3 == 0 ]) #打印30以内能被3整除的数的平方
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],
['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']] print([name for lst in names for name in lst if name.count('e') >= 2]) # 注意遍历顺序,这是实现的关键
找到嵌套列表中名字含有两个‘e’的所有名字
二、字典推导式:
mcase = {'a': 10, 'b': 34}
mcase_frequency = {mcase[k]: k for k in mcase}
print(mcase_frequency)
将一个字典的key和value对调
mcase = {'a': 10, 'b': 34, 'A': 7, 'Z': 3}
mcase_frequency = {k.lower(): mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0) for k in mcase.keys()}
print(mcase_frequency)
合并大小写对应的value值,将k统一成小写
三、集合推导式:
squared = {x**2 for x in [1, -1, 2]}
print(squared)
# Output: set([1, 4])
计算列表中每个值的平方,自带去重功能