python3中生成器和列表推导式的优点和缺点

Python3中的列表推导式一次性加载所有值到内存,适合小数据量处理;生成器通过()实现延迟计算,减少内存占用,适用于大数据量。生成器还提高了代码可读性,但只能遍历一次。

python3中列表推导式和生成器的不同:

(1)

列表推导式是将所有的值一次性加载到内存中

生成器是将列表推导式的[]改成(),不会将所有的值一次性加载到内存中,延迟计算,一次返回一个结果,它不会一次生成所有的结果,这对大数据量处理,非常有用

def fun():
    for i in range(1,50):
        sleep(1)
        yield i

for i in fun():
    print(i)
# 生成器函数: 一个函数中包含了yield关键,那么这个函数就不是普通的函数,是一个生成器函数
# 调用生成器函数,不会立马执行该函数里面的代码, 而是会返回一个 生成器
def func():
    print("a")
    yield
    print("b")
    yield
    print("c")
    yield
    print("d")
    yield
generator = func()
print(generator)
print(type(generator))

# next(generator)
# next(generator)
# next(generator)
for i in generator:
    pass

sum(x for x in range(10000000000))
sum([x for x in range(10000000000)])

第一个几乎没什么内存占用,第二个内存占有很多

原理:sum函数时python3中的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议,所以我们可以直接计算一系列值的和,而不用多此一举先构造一个列表.

生成器还可以提高代码的可读性:

# 求一段文字中,每个单词出现的位置
def index_words(text):
    result = []
    if text:
        result.append(0)
    for index,letter in enumerate(text,1):
        if letter == ' ':
            result.append(index)
    return result

def index_words(text):
    if text:
        yield 0
    for index,letter in enumerate(text,1):
        if letter == '':
            yield index


(2)

列表推导式可以遍历任意次

生成器只能遍历一次

generator = (i for i in range(1,5))
print(next(generator))
print(next(generator))
for i in generator:
    print(i)
for i in generator:
    print(i)
打印结果:

1
2
3
4


list1 = [i for i in range(1,5)]
print(list1[0])
print(list1[1])
print(list1[2])
for i in list1:
    print(i)
for i in list1:
    print(i)
打印结果:

1
2
3
1
2
3
4
1
2
3
4



Python 中,**推导式(Comprehensions)** **生成器(Generators)** 都是用于创建可迭代对象的简洁方式,但它们在内存使用、执行时机返回类型上有显著区别。 --- ### 一、列表推导式 vs 生成器表达式 #### 1. 列表推导式(List Comprehension) - 立即执行,生成一个完整的列表。 - 占用较多内存(因为存储所有元素)。 - 使用方括号 `[]`。 ```python # 列表推导式:立即生成所有元素 squares_list = [x**2 for x in range(5)] print(squares_list) # 输出: [0, 1, 4, 9, 16] print(type(squares_list)) # <class &#39;list&#39;> ``` > ✅ 优点:可以重复遍历、支持索引、切片。 > ❌ 缺点:占用内存大,尤其数据量大时。 --- #### 2. 生成器表达式(Generator Expression) - 惰性求值(lazy evaluation),按需生成元素。 - 只能遍历一次。 - 使用圆括号 `()`。 ```python # 生成器表达式:不立即计算,只返回一个生成器对象 squares_gen = (x**2 for x in range(5)) print(squares_gen) # <generator object <genexpr> at 0x...> print(next(squares_gen)) # 0 print(next(squares_gen)) # 1 # 或者一次性遍历 for val in squares_gen: print(val) # 会从 4 开始输出(前面已取走两个) ``` > ✅ 优点:节省内存,适合大数据流处理。 > ❌ 缺点只能遍历一次,不支持索引或切片。 --- ### 二、对比总结 | 特性 | 列表推导式 `[...]` | 生成器表达式 `(...)` | |------|------------------|--------------------| | 执行方式 | 立即执行 | 惰性求值(延迟计算) | | 内存占用 | 高(存储全部数据) | 低(按需生成) | | 是否可重复遍历 | 是 | 否(遍历一次后耗尽) | | 支持索引/切片 | 是 | 否 | | 类型 | `list` | `generator`(属于迭代器) | --- ### 三、自定义生成器函数(Generator Function) 除了生成器表达式,还可以用 `yield` 定义更复杂的生成器: ```python def fibonacci(): a, b = 0, 1 while True: yield a a, b = b, a + b # 使用生成器 fib = fibonacci() for _ in range(5): print(next(fib)) # 0, 1, 1, 2, 3 ``` 这个函数永远不会真正返回所有值,而是“按需”产生下一个斐波那契数,非常适合无限序列。 --- ### 四、何时使用? - **使用列表推导式**: - 数据量小; - 需要多次访问或索引; - 想快速构建列表进行操作。 - **使用生成器表达式或函数**: - 处理大量数据(如读取大文件); - 实现惰性加载; - 构建管道式数据流(类似 Unix 管道); 示例:逐行处理大文件中的数字平方 ```python # 假设有一个大文件,每行一个数字 def read_numbers(filename): with open(filename, &#39;r&#39;) as f: for line in f: yield int(line.strip()) # 构建处理流水线(完全惰性,内存友好) squared_evens = (x**2 for x in read_numbers(&#39;numbers.txt&#39;) if x % 2 == 0) for sq in squared_evens: print(sq) ``` --- ### 总结 - 推导式(特别是列表推导式)是**语法糖**,用来快速构造容器。 - 生成器是**迭代器的一种**,通过 `yield` 或生成器表达式创建,实现**惰性计算**。 - 两者核心区别在于:**是否立即生成并保存所有数据**。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值