能以一种一致的方式对序列进行迭代(比如列表中的对象或文件中的行)是python的一个重要特点。这是通过一种叫做迭代器协议(iterator protocol,它是一种使对象可迭代的通用方式)的方式实现。
例:对字典进行迭代可以得到其所有的键
some_dict = {'a':1 , 'b':2 , 'c':3}
for key in some_dict:
print key
得到结果
a
b
c
当编写for key in some_dict时,python解释器首先会尝试从some_dict创建一个迭代器:
dict_iterator=iter(some_dict)
dict_iterator
得到结果
<dict_keyiterator object at 0x023864E0>
迭代器是一种特殊对象,可以通过诸如for循环之类(对象重复调用)向python解释器输送对象。大部分能接受列表之类对象的方法也都可以接受任何可迭代对象,如min、max、sum等内置方法以及list、tuple等类型构造器。
list(dict_iterator)
得到结果
['a' , 'b' , 'c']
生成器(generator)是构造新的可迭代对象的一种简单方式。一般的函数return只会返回单个值,而生成器并不是直接将可迭代值直接放入内存中,而是以延迟的方式返回一个值序列,即每返回一个值之后暂停,直到下一个值被请求时再继续,可有效节省内存占用。要构建一个生成器,则需要用到关键字yield,yield的作用与函数的返回值return有些类似,通过在函数中将return替换成yield就是把函数变成生成器,带有 yield 的函数不再是普通函数,python 解释器会将函数对象视为生成器对象,并且该生成器返回的是yield表达式生成的可迭代值序列,可通过for循环等方法依次读取生成器返回的可迭代值序列,但生成器生成的可迭代值只可以被读取一次,每一次迭代都是按生成器代码流程遇见yield表达式就返回值并记录位置后中止留待下一次迭代,下一次迭代时执行代码的起始位置是从上一次记录位置开始,直至整个生成器代码运行结束。上面解释可能比较空洞,接下来看几个例子。
例:普通函数
#普通函数使用return关键字是将函数对象在被调用后返回某个值
#return表达式后也不允许存在代码,代码执行到return表达式后程序结束
#return语句就是整个函数的最后一条语句,不写return则默认返回None
#定义函数
def yield_test(n):
return n*2
# print('i=' , i)不允许存在return后的代码,如存在会报缩进错误
#调用函数
print(yield_test(5), ',')
得到结果
10 ,
例:与函数类似的生成器
#将普通函数的return关键字替换成yield关键字,函数yield_test()将被视为生成器(generator)
#yield与return同样返回值,记录位置后中止,下次迭代从该位置开始按代码流程执行直至再次遇见yield
#每一次迭代都是遇到yield就中止并返回yield表达式的值,下次迭代从上次迭代yield后面的代码开始执行
#定义生成器
def yield_test(n):
yield n*2
print('n=' , n)
#执行other代码
print('do something.')
print('end.')
#调用生成器
for i in yield_test(5):
print(i, ',')
print('next')
执行调用生成器的 for i in yield_test(5)语句时,因生成器yield_test()的返回值yield n*2虽然是可迭代对象但并没有可供循环的可迭代值(只有一个n=5时的yield返回值n*2=10),因此 for i in yield_test(5)实际只进行了2次循环,循环第1次在执行代码 yield n*2后中止并返回 yield n*2的值,生成器返回值调用结束后,循环第2次继续上次执行yield n*2后的剩余生成器代码也就是print(‘n=’ ,n)直至yield_test()代码结束后退出
得到结果
10 , #代码执行生成器返回值语句 yield n*2
next #循环第1次结束
n= 5 #循环第2次开始,但生成器内已不会再次遇到yield,继续执行后续代码直至生成器结束
do something.
end.
例:生成器(完整执行多次调用for循环代码的生成器)
#定义生成器
def yield_test(n):
for r in range(n):
yield r*2
print('r=' , r)
#执行other代码
print('do something.')
print('end.')
#调用生成器
for i in yield_test(5):
print(i, ',')
print('next')
执行循环调用 for i in yield_test(5) 的 print(i, ‘,’) 语句时,生成器yield_test()的返回值yield n*2是可迭代对象并存在可供循环的可迭代值(range(5)时的返回值序列[0,2,4,6,8]),因此print(i , ‘,’)将循环使用5次,循环第1次在n=0时执行代码 yield n*2后中止并返回 yield n*2的值,在生成器返回值调用print(‘next’)结束后,循环第2次继续执行yield n*2后的剩余生成器代码也就是print(‘r=’ ,r)并在n=1时执行代码yield n*2后中止并返回yield n*2的值,如此往复直至