Python 生成器\迭代器
一、什么是生成器?
通过列表生成式,我们可以直接创建一个列表,但是,受到内存限制,列表容量肯定是有限的,而且创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间,在Python中,这种一边循环一边计算的机制,称为生成器:generator
生成器是一个特殊的程序,可以被用作控制循环的迭代行为,python中生成器是迭代器的一种,使用yield返回值函数,每次调用yield会暂停,而可以使用next()函数和send()函数恢复生成器。
生成器类似于返回值为数组的一个函数,这个函数可以接受参数,可以被调用,但是,不同于一般的函数会一次性返回包括了所有数值的数组,生成器一次只能产生一个值,这样消耗的内存数量将大大减小,而且允许调用函数可以很快的处理前几个返回值,因此生成器看起来像是一个函数,但是表现得却像是迭代器.
在Python中要创建一个generator,有很多种方法:
- 列表生成式的[]改为()
L = [i for i in range(10)]
print(L)
l = (i for i in range(10))
print(l)
>>>[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>><generator object <genexpr> at 0x000001CF31D95B48>
#用next打印生成器中的元素,当容器中没有元素时,next会抛出StopIteration的错误.
#因为generator也是可迭代对象,所以也可以用for进行遍历
- 函数实现(斐波拉契数列)
斐波拉契数列: 1,1,2,3,5,8,13,21,…
#正常写法:
def fib(max_value):
prev =0
curr = 1
while curr < max_value:
print(curr)
prev,curr = curr,curr+prev
fib(10)
>>>1
>>>1
>>>2
>>>3
>>>5
>>>8
#生成器函数(将print改成yield)
def fib(max_value):
prev =0
curr = 1
while curr < max_value:
yield curr
prev,curr = curr,curr+prev
print(list(fib(10)))
>>>[1, 1, 2, 3, 5, 8]
函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。
def foo():
print(111)
yield 222
print(333)
yield 444
n = foo()
next(n)
next(n)
next(n)
>>>111
>>>333
>>>Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
#foo不是普通函数,而是generator,在执行过程中遇到yield就中断,下次又继续执行
二、迭代器
可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator
直接作用于for循环的数据类型有以下几种:
- 集合数据类型,如:list,tuple,dict,set,str等;
- generator,包括生成器和带yield的generator function
这些可以直接作用于for循环的对象称为可迭代对象:Iterable(使用isinstance()判断一个对象是否为可迭代对象或者Iterator)
注:
- 可作用于for循环的对象都是Iterable类型;
- 可作用于next()函数的对象都是Iterator类型,表示一个惰性计算的序列;
- 集合数据类型list,dict,str等是Iterable但不是Iterator,可以通过Iter()函数获得一个Iterator对象.
#任何实现了__iter__和__next__方法的对象都是迭代器
# python2中没有__next__(),而是next()
class Range:
def __init__(self,start,end=None,step=1):
if end is None:
self.end = start
self.start = 0
else:
self.start = start
self.end = end
self.step = step
#iter 得到一个迭代器,返回自身
def __iter__(self):
return self
# 返回迭代器下一个值
def __next__(self):
if self.start < self.end:
current = self.start
self.start += self.step
return current
else:
# 如果容器里没有更多元素,抛出异常
raise StopIteration
for i in Range(10):
print(i)
#迭代器 实现斐波那契数列
class Fib:
def __init__(self,max_value):
self.prev = 0
self.curr = 1
self.max_value = max_value
def __iter__(self):
return self
def __next__(self):
if self.curr <= self.max_value:
res = self.curr
self.prev,self.curr = self.curr,self.prev+self.curr
return res
else:
raise StopIteration
for i in Fib(10):
print(i)