什么是迭代器?
迭代器是Python中一种访问集合元素的方式,它可以记住遍历的位置。迭代器对象从集合的第一个元素开始访问,直到所有元素被访问完结束。
目录
1. 基本操作:iter() 和 next()
-
iter()
: 用于创建迭代器对象 -
next()
: 用于获取迭代器的下一个元素
# 创建一个列表
my_list = [1, 2, 3]
# 创建迭代器对象
my_iter = iter(my_list)
# 使用next()获取元素
print(next(my_iter)) # 输出: 1
print(next(my_iter)) # 输出: 2
print(next(my_iter)) # 输出: 3
2. 创建一个迭代器
要创建一个迭代器,需要实现__iter__()
和__next__()
方法。
__iter__() 方法返回一个特殊的迭代器对象, 这个迭代器对象实现了 __next__() 方法并通过 StopIteration 异常标识迭代的完成。
__next__() 方法(Python 2 里是 next())会返回下一个迭代器对象。
class MyNumbers:
def __iter__(self):
self.a = 1
return self
def __next__(self):
if self.a <= 5:
x = self.a
self.a += 1
return x
else:
raise StopIteration
myclass = MyNumbers()
myiter = iter(myclass)
for x in myiter:
print(x)
3. StopIteration
当没有更多元素可用时,迭代器应该抛出StopIteration
异常。
StopIteration 异常用于标识迭代的完成,防止出现无限循环的情况,在 __next__() 方法中我们可以设置在完成指定循环次数后触发 StopIteration 异常来结束迭代。
my_list = [1, 2, 3]
my_iter = iter(my_list)
while True:
try:
print(next(my_iter))
except StopIteration:
print("没有更多元素了")
break
4. 使用场景
-
处理大型数据集:迭代器可以逐个处理数据,而不需要一次性加载所有数据到内存
# 读取大文件 with open('large_file.txt') as f: for line in f: # 文件对象本身就是迭代器 process(line)
-
无限序列:可以表示无限的数据流
class InfiniteNumbers: def __iter__(self): self.num = 0 return self def __next__(self): self.num += 1 return self.num for num in InfiniteNumbers(): if num > 100: # 需要手动设置终止条件 break print(num)
-
节省内存:生成器表达式是创建迭代器的简洁方式
# 列表推导式 - 立即创建完整列表 squares_list = [x**2 for x in range(1000000)] # 占用大量内存 # 生成器表达式 - 创建迭代器 squares_gen = (x**2 for x in range(1000000)) # 几乎不占内存
-
自定义容器类:让你的类支持迭代
class MyContainer: def __init__(self, data): self.data = data def __iter__(self): return iter(self.data) container = MyContainer([1, 2, 3]) for item in container: print(item)
迭代器是Python中非常强大的概念,它使得我们可以高效地处理大量数据,同时保持代码的简洁性和可读性。