生成器和迭代器的区别

生成器(Generator)和迭代器(Iterator)是Python 中用于处理序列数据的两种机制。

迭代器

  • 定义:迭代器是一个实现了 __iter____next__ 方法的对象。__iter__ 返回迭代器对象本身,而 __next__ 则返回容器中的下一个值。
  • 创建方式:通过实现上述两个方法来创建一个迭代器对象。
  • 使用场景:适用于需要对数据集合进行遍历的情况,如列表、元组等。
  • 内存占用:迭代器在访问元素时逐个生成,因此可以节省内存,特别是对于大的数据集。

示例:手动实现一个数字递增的迭代器

#! /usr/bin/env/python3
# -*- coding=utf-8 -*-
# @Author: jack
# @Date  : 2025/06/13/15:25

class MyIterator:

    def __init__(self, start=0, step=1):
        self.start = start
        self.step = step

    def __iter__(self):
        # 返回迭代器本身
        return self

    def __next__(self):
        if self.start >= 100:  # 设置终止条件
            raise StopIteration
        value = self.start
        self.start += self.step
        return value


my_iter = MyIterator(start=10, step=5)
for num in my_iter:
    print(num)

生成器

  • 定义:生成器是一种特殊的迭代器,它通过函数来创建,并且这个函数含有 yield 语句而不是 return。每次调用生成器的__next__() 方法时,它会从上次离开的地方继续执行,知道遇到下一个 yield 语句。
  • 创建方式:使用函数以及 yield 关键字来创建生成器。当函数执行到 yield 时,会暂停并保存当前所有的运行信息,返回 yield 的值,并在下一次调用时从该位置继续执行。
  • 使用场景:特别适合用来简化创建复杂的迭代器的过程,尤其当你需要在遍历过程中动态产生数据的时候。
  • 内存占用:与迭代器类似,生成器也是惰性求值,即只有在需要时才会计算值。
def my_generator():
    yield 1
    yield 2
    yield 3

gen = my_generator()
for x in gen:
    print(x)

总结

  • 迭代器适用于当你想要遍历现有集合而不必一次加载整个集合到内存中时。
  • 生成器则更适用于你需要动态生成数据,特别是当这些数据集过大以至于无法全部放入内存中时。生成器通过惰性计算提供了一种更为高效的方式来处理大规模数据集,从而进一步降低了内存消耗。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值