Python基础教程（八）循环：Python循环永动机：你以为它只会转圈？

当你的代码陷入无限循环时，Python其实在悄悄进化。

Python循环远不止是重复执行代码块的工具。从经典的for与while，到隐藏的迭代器协议，再到性能优化利器itertools，本文将揭示如何让循环成为你代码中的高效引擎而非性能瓶颈。

一、基础循环结构：不止是语法糖

# 传统for循环
fruits = ["apple", "banana", "cherry"]
for fruit in fruits:
    print(fruit.upper())

# 循环的隐藏力量：迭代器协议
class Fibonacci:
    def __init__(self, limit):
        self.limit = limit
        self.a, self.b = 0, 1
        
    def __iter__(self):
        return self
        
    def __next__(self):
        if self.a > self.limit:
            raise StopIteration
        result = self.a
        self.a, self.b = self.b, self.a + self.b
        return result

# 使用自定义迭代器
print("斐波那契数列：")
for num in Fibonacci(100):
    print(num, end=" ")

Python的for循环本质是迭代器协议的语法糖。理解__iter__和__next__魔法方法，可创建自定义迭代对象处理海量数据流，避免一次性加载全部数据到内存。

二、循环陷阱：90%开发者踩过的坑

1. 动态修改迭代列表

# 危险操作：循环中修改列表
numbers = [1, 2, 3, 4]
for num in numbers:
    if num % 2 == 0:
        numbers.remove(num)  # 导致跳过元素！
print(numbers)  # 输出：[1, 3] 但预期是[1,3]？实际可能跳过3

# 安全方案
numbers = [x for x in numbers if x % 2 != 0]  # 列表推导式

解决方案：创建副本或使用列表推导式。修改原始集合会导致迭代器内部索引混乱。

2. 嵌套循环的性能灾难

# O(n²) 时间复杂度的双重循环
matrix = [[1,2,3], [4,5,6], [7,8,9]]
for i in range(len(matrix)):
    for j in range(len(matrix[0])):
        print(matrix[i][j])

# 优化为O(n)的单层循环
import itertools
for item in itertools.chain(*matrix):
    print(item)

当数据量增长时，多重循环时间复杂度呈指数级上升。itertools.chain()可将嵌套结构扁平化处理。

三、循环加速器：解锁高性能技巧

1. 推导式：循环的语法进化

# 传统循环
squares = []
for x in range(10):
    squares.append(x**2)

# 列表推导式（快30%）
squares = [x**2 for x in range(10)]

# 带条件的字典推导式
even_squares = {x: x**2 for x in range(10) if x % 2 == 0}

2. 生成器：惰性计算的王者

# 生成器表达式（内存友好）
million_squares = (x**2 for x in range(1000000))

# 检查内存占用
import sys
print(sys.getsizeof(million_squares))  # 输出：<200字节

# 对比列表内存
print(sys.getsizeof([x**2 for x in range(1000000)]))  # 输出：>8MB

生成器采用惰性求值机制，仅在需要时产生数据，完美处理GB级日志文件或实时数据流。

四、循环控制：精细化管理流

语句	作用	典型场景
`break`	立即终止整个循环	搜索到目标后提前退出
`continue`	跳过当前迭代进入下一次	过滤特定类型数据
`else`	循环正常结束执行	循环未中断时的收尾操作
`enumerate`	获取元素索引	需要索引的遍历操作

# 循环else子句的妙用
for url in url_list:
    response = requests.get(url)
    if response.status_code == 404:
        break
else:  # 未遇到break时执行
    print("所有URL访问成功！")

五、终极武器：itertools模块详解

Python标准库的itertools提供工业级循环工具：

import itertools

# 1. 无限迭代器
count = itertools.count(start=10, step=2)  # 10,12,14...

# 2. 组合生成器
# 排列：ABC → AB AC BA BC CA CB
perms = itertools.permutations('ABC', 2)

# 组合：ABC → AB AC BC
combs = itertools.combinations('ABC', 2)

# 3. 高效分组
data = sorted([('A', 80), ('B', 90), ('A', 85)])
for key, group in itertools.groupby(data, key=lambda x: x[0]):
    print(f"{key}: {list(group)}")

六、循环的哲学：从重复到进化

"我们不能用制造问题时的同一思维来解决问题。" —— 爱因斯坦

在Python中，循环不应是简单的重复工具：

数据驱动：用pandas.DataFrame.iterrows()处理结构化数据
事件驱动：在异步框架中通过事件循环实现高并发
并行化：concurrent.futures将循环任务分发多核

# 多进程加速CPU密集型循环
from concurrent.futures import ProcessPoolExecutor

def compute_cube(n):
    return n**3

with ProcessPoolExecutor() as executor:
    results = executor.map(compute_cube, range(1000000))

真正的Python循环大师，懂得何时避免循环。在向量化操作领域，NumPy只需一行代码即可完成传统循环的所有工作：

import numpy as np
# 传统循环
arr = list(range(1000000))
squares = [x**2 for x in arr]

# NumPy向量化（速度提升50倍）
arr = np.arange(1000000)
squares = arr**2  # 闪电般完成

当循环成为必需品时，请记住：优秀的迭代器设计比暴力循环更重要。Python的循环不是车轮，而是将你代码推向新高度的涡轮引擎。