(一)迭代器协议和for循环工作机制
1、迭代器协议
- 协议是一种约定,对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个Stopiteration异常,以终止迭代(只能往后走不能往前退)
- Python的内部工具(如for循环,sum,min,max函数等)使用迭代器协议访问对象。
2、可迭代对象
Iterable,实现了迭代器协议的对象(如何实现:对象内部定义一个__iter__()方法),可以使用
isinstance()
判断一个对象是否是Iterable
对象>>> from collections import Iterable >>> isinstance([], Iterable) True >>> isinstance({}, Iterable) True >>> isinstance('abc', Iterable) True >>> isinstance((x for x in range(10)), Iterable) True >>> isinstance(100, Iterable) False
3、Python中for循环机制
- for循环的本质:循环所有对象,全都是使用迭代器协议。
- 字符串、列表、元组、字典、集合、文件对象,虽然是可迭代对象Iterable,但不是迭代器对象Iterator,只不过在for循环时,调用了它们内部的__iter__方法,把它们变成了可迭代器对象(内置的
iter()
函数可以把Iterable变成Iterator,本质上就是调用了__iter__方法),生成器都是Iterator
对象- for循环调用可迭代对象的__next__方法去取值,而且for循环会捕捉Stopiteration异常,以终止迭代。
- Python内置函数next(iter),就是调用可迭代对象iter的__next__方法。
可以直接作用于
for
循环的数据类型有以下几种:一类是集合数据类型,如
list
、tuple
、dict
、set
、str
等;一类是
generator
,包括生成器和带yield
的generator function。