1. 生成器
在循环过程中不断提供数据: 生成器 generator
1.1 创建生成器方法1
要创建一个生成器,有很多种方法。第一种方法很简单,只要把一个列表生成式的 [ ] 改成 ( )
G = ( x*2 for x in range(5))
G
<generator object <genexpr> at 0x000001780CFE2EB8>
使用next()
函数获得生成器的下一个返回值
In [19]: next(G)
Out[19]: 0
计算到没有更多对象的时候,会抛出StopIteration
的异常。因为生成器也是可迭代对象, 可以通过for
循环来迭代,而不需要担心StopIteration
异常
创建生成器方法2
def fib(times):
n = 0
a,b = 0,1
while n < times:
print(b)
a,b = b, a+b
n +=1
return 'done'
fib(5)
1
1
2
3
5
将fib函数变成generator
,只需要把print(b)
变成yield b
def fib(times):
n = 0
a,b = 0,1
while n < times:
yield b
a,b = b, a+b
n +=1
f = fib(6)
type(f)
generator
- generator保存的是算法,每次调用
next(f)
,就计算出f的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误. - generator和函数的执行流程不一样。函数是顺序执行,遇到
return
语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()
的时候执行,遇到yield
语句返回,再次执行时从上次返回的yield
语句处继续执行。 - 同样的,把函数改成generator后,我们基本上从来不会用
next()
来获取下一个返回值,而是直接使用for
循环来迭代
>>> for n in fib(6):
... print(n)
...
1
1
2
3
5
8
但是用for
循环调用generator时,发现拿不到generator的return
语句的返回值。如果想要拿到返回值,必须捕获StopIteration
错误,返回值包含在StopIteration
的value
中:
while True:
try:
x = next(f)
print("f", x)
except StopIteration as e:
print("genenator return 返回值" ,e.value)
break
2 迭代器
我们已经知道,可以直接作用于for
循环的数据类型有以下几种:
- 一类是集合数据类型,如
list
、tuple
、dict
、set
、str
等; - 一类是
generator
,包括生成器和带yield
的generator function。
可迭代对象Iterable
这些可以直接作用于for
循环的对象统称为可迭代对象:Iterable
。可以使用isinstance()
判断一个对象是否是Iterable
对象:
from collections import Iterable
isinstance([], Iterable)
迭代器Iterator
可以使用isinstance()
判断一个对象是否是Iterator
对象 :
from collections import Iterator
isinstance((x for x in range(10)), Iterator)
生成器都是Iterator
对象,但list
、dict
、str
虽然是Iterable
,却不是Iterator
。把list
、dict
、str
等Iterable
变成Iterator
可以使用iter()
函数:
isinstance(iter([]), Iterator)
True
因为Python的Iterator
对象表示的是一个数据流,Iterator对象可以被next()
函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration
错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()
函数实现按需计算下一个数据,所以Iterator
的计算是惰性的,只有在需要返回下一个数据时它才会计算。 另外,迭代器只能往前不会后退。