for循环的本质
我们常常会写如下的代码
a = [1,2,3]
for item in a:
print(item)
for i in range(10):
print(i)
for i, item in enumerate(a):
print(i, item)
第一部分代码例子很好理解,循环遍历列表 a 里面的元素。 python 的 for … in … 语义非常清晰。
第二部分代码例子和第一部分比较起来,似乎 range(10) 和列表等价。
第三部分代码例子和第一部分比较起来, enumerate(a) 每次迭代会返回两个元素,第一个 i 代表序号。
究竟是不是这样呢。 python 这几个关键字是怎么让其在迭代用法这么灵活呢(想想java 等其他语言吧)。
有部分读者可能有了解过。迭代器协议
迭代器协议:
- 实现
__iter__
方法, 该方法返回迭代器对象。 - 实现
__next__
方法,该方法返回迭代的值,抛出 StopIteration 表示停止迭代。
可能还是云里雾里的,没关系,我们直接看一个例子。
class A:
def __init__(self, end):
self.i = -1
self.end = end
def __iter__(self):
return self
def __next__(self):
self.i += 1
if self.i < self.end:
return self.i
else:
raise StopIteration()
for i in A(10):
print(i)
这个时候 我们可以发现 A(10) 的效果和 range(10) 一毛一样! 打印从 0 - 9 。
那么 range 函数是不是这样做的呢。 我们来看看。 在看之前我们需要了解一个知识点。
- 工具 dir 函数。 内置 dir 函数能获取对象的属性和方法描述。
print(dir(range(10)))
# 输出结果
['__bool__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'count', 'index', 'start', 'step', 'stop']
我们可以看到, range(10) 确实有一个 __iter__
方法,但是它并没有__next__
方法。这是怎么回事呢。
print(dir(range(10).__iter__()))
# 输出结果
['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__length_hint__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setstate__', '__sizeof__', '__str__', '__subclasshook__']
奥,原来__next__
方法在这。 range(10) 的实现将迭代数据和对象本身进行了分离。 这样你对上文的描述是不是理解的更深了一些。 这也就是__iter__
方法的用处。很多书本可能没提到这点。 甚至直接搞混淆的,说返回其本身。__iter__
返回含有__next__
方法的对象。而不想分离的时候就返回对象本身。这种设计是不是更灵活了呢。
- 动手题
1.自己试试探索一下文章开头的其余两个代码例子吧。