1. 迭代器必须包含 __iter__()
和 __next__()
吗?
是的,Python 迭代器(Iterator)必须实现 __iter__()
和 __next__()
方法。但 __iter__()
其实可以返回 self
,它的作用只是为了让迭代器和可迭代对象兼容。
1.1 迭代器的定义
一个迭代器(Iterator) 必须:
- 实现
__iter__()
方法,返回自身self
。 - 实现
__next__()
方法,每次调用返回下一个值,遇到数据耗尽时抛出StopIteration
。
1.2 示例:自定义迭代器
class MyIterator:
def __init__(self, start, end):
self.current = start
self.end = end
def __iter__(self):
return self # 迭代器的 `__iter__()` 必须返回自身
def __next__(self):
if self.current >= self.end:
raise StopIteration # 迭代结束
value = self.current
self.current += 1
return value
# 创建迭代器对象
it = MyIterator(1, 5)
# 使用 `next()`
print(next(it)) # 1
print(next(it)) # 2
# 也可以用 `for` 循环
for num in MyIterator(1, 5):
print(num)
🔹 输出:
1
2
1
2
3
4
注意:
__iter__()
只是返回self
,让迭代器可以被iter()
调用(如iter(it)
)。__next__()
控制迭代逻辑,每次返回一个值,最后抛出StopIteration
。
1.3 为什么 __iter__()
必须返回 self
?
因为Python 规定 iter(iterator)
必须返回可用的迭代器:
it = MyIterator(1, 5)
print(iter(it) is it) # ✅ True,说明 `it` 仍然是一个迭代器
如果 __iter__()
返回别的对象,next()
可能无法工作,比如:
class BadIterator:
def __iter__(self):
return [] # ❌ 不是迭代器
def __next__(self):
return 42
it = BadIterator()
next(it) # ❌ TypeError: 'BadIterator' object is not an iterator
🔹 报错:
TypeError: 'BadIterator' object is not an iterator
这里 __iter__()
返回了 list
,但 list
不是 迭代器,所以 next(it)
不能调用 __next__()
,导致错误。
1.4 可迭代对象 vs. 迭代器
类别 | 必须有 __iter__() |
必须有 __next__() |
例子 |
---|---|---|---|
可迭代对象 | ✅ 是 | ❌ 不是 | list ,tuple ,dict ,set |
迭代器 | ✅ 是 | ✅ 是 | map ,filter ,zip ,自定义迭代器 |
🔹 可迭代对象示例:
class MyIterable:
def __iter__(self):
return iter([1, 2, 3]) # 返回一个真正的迭代器
obj = MyIterable()
for num in obj