Python基础教程（十七）迭代：Python迭代的红色药丸：吞下它，看透循环的本质-优快云博客

当你在Python中写下for item in my_list:时，是否想过这行简洁代码背后的惊人机制？是时候选择那颗红色药丸了。

在Python的世界里，迭代（Iteration） 如呼吸般自然。我们熟练地使用for循环遍历列表、字典、字符串，却很少追问：这一切如何运作？为何一个for能遍历截然不同的对象？吞下这颗红色药丸，我们将深入迭代器协议的核心，揭示Python统一迭代模型的精妙设计。

🔵 蓝色药丸：舒适的表面世界（基础迭代）

# 熟悉的遍历场景
numbers = [1, 2, 3, 4]
for num in numbers:  # 遍历列表
    print(num * 2)

word = "Python"
for char in word:   # 遍历字符串
    print(char.upper())

my_dict = {'a': 1, 'b': 2}
for key in my_dict:  # 遍历字典键
    print(key, "->", my_dict[key])

这是多数人眼中的迭代——简洁的for循环。Python用一致的语法处理不同数据结构，背后隐藏着强大的抽象层。

🔴 红色药丸：迭代器协议的真相（核心机制）

Python的迭代建立在迭代器协议（Iterator Protocol） 之上，它只需两个魔法方法：

__iter__()：返回迭代器对象自身
__next__()：返回下一个元素，耗尽时抛出StopIteration

# 手动模拟for循环机制
numbers = [10, 20, 30]
iterator = iter(numbers)  # 等价于 numbers.__iter__()

print(next(iterator))  # 输出: 10
print(next(iterator))  # 输出: 20
print(next(iterator))  # 输出: 30
print(next(iterator))  # 引发 StopIteration

⚙️ 构建自己的迭代器（从理论到实践）

class Countdown:
    """倒计时迭代器"""
    def __init__(self, start):
        self.current = start
    
    def __iter__(self):
        return self  # 必须返回迭代器对象
    
    def __next__(self):
        if self.current <= 0:
            raise StopIteration
        num = self.current
        self.current -= 1
        return num

# 使用自定义迭代器
for i in Countdown(5):
    print(i)  # 输出: 5, 4, 3, 2, 1

⚡ 生成器：优雅的迭代器工厂（语法糖的力量）

生成器函数用yield简化迭代器创建，自动实现协议：

def fibonacci_gen(max_count):
    """生成斐波那契数列的生成器"""
    a, b, count = 0, 1, 0
    while count < max_count:
        yield a
        a, b = b, a + b
        count += 1

# 生成器的惰性求值节省内存
fib_sequence = fibonacci_gen(10)
print(list(fib_sequence))  # 输出: [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

🚫 迭代中的隐秘陷阱（避坑指南）

耗尽陷阱：迭代器只能使用一次

nums = iter([1, 2, 3])
list(nums)  # [1, 2, 3]
list(nums)  # [] 迭代器已耗尽！

可变对象修改：遍历中修改容器可能导致意外

data = [1, 2, 3, 4]
for x in data:
    if x % 2 == 0:
        data.remove(x)  # 危险操作！可能导致跳过元素

🚀 高效迭代实战技巧（性能优化）

使用itertools模块处理复杂迭代逻辑

from itertools import islice, chain

# 合并多个迭代器
combined = chain('ABC', range(3))

# 惰性切片大型数据集
big_data = (x*x for x in range(1000000))
first_100 = list(islice(big_data, 100))

生成器表达式处理海量数据

# 传统列表推导（立即加载所有数据）
squares = [x**2 for x in range(1000000)]  # 高内存消耗

# 生成器表达式（惰性计算）
squares_gen = (x**2 for x in range(1000000))  # 低内存

💡 迭代哲学：Python设计之美

Python的迭代协议体现了其**“鸭子类型”** 思想——只要对象实现了__iter__()和__next__()，它就是一个迭代器。这种设计带来惊人一致性：

文件对象：逐行读取文本
网络数据流：分块接收字节
数据库游标：逐行获取结果

# 统一接口处理不同数据源
def process_iterable(iterable):
    for item in iterable:
        print(f"Processing: {item}")

# 可处理列表、文件、生成器等任何可迭代对象
process_iterable([1, 2, 3])
process_iterable(open('data.txt'))
process_iterable(fibonacci_gen(5))