Python迭代器基本方法iter()及其魔法方法__iter__()原理详解

Python迭代器的基本方法:iter()、next()

迭代器:

  • 迭代器是一个可以记住遍历的位置的对象。
  • 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。

通常在我们对iter()、next()进行简单使用时是这样的:

a=[1,2,3]
it=iter(a) #创建迭代器对象
next(it)   #输出迭代器下一项
next(it)
next(it)
#输出:
#1
#2
#3

当看到使用自定义迭代器时,有些问题着实疑惑,看如下代码:

class MyNumbers:
  def __iter__(self):
    self.a = 1
    return self
 
  def __next__(self):
    x = self.a
    self.a += 1
    return x
 
myclass = MyNumbers()
myiter = iter(myclass)
 
print(next(myiter))
print(next(myiter))
print(next(myiter))
print(next(myiter))
print(next(myiter))

这是菜鸟教程给的实例
我的疑惑点:
1.iter()咋直接对实例化对象myclass直接操作了起来?
2.iter()、next()如上操作的原理是啥?内部过程是啥?

随着这些问题继续探究

2.魔法方法的解释

        魔法方法是python内置方法,不需要主动调用,存在的目的是为了给python的解释器进行调用,几乎每个魔法方法都有一个对应的内置函数,或者运算符,当我们对这个对象使用这些函数或者运算符时就会调用类中的对应魔法方法可以理解为重写这些python的内置函数

        我们在调用python类中的某个方法时,通常会看到某些特殊的方法,它们总被双下划线所包围,像这种格式:"__ 方法名__",这些方法很强大,充满魔力,可以让你实现很多功能。如果你的对象实现(重载)了这些方法中的某一个,那么这个方法就会在特殊的情况下被 Python 所调用,你可以定义自己想要的行为,而这一切都是自动发生的。

重点提取:
1.魔法方法:__ 方法名 __,如:

__iter__(self)
__next__(self)

2.当我们对一个实例化对象使用内置函数时(这个实例化对象中我们自定义了与这个内置函数对应的魔法方法),相当于我们对这个内置函数进行了重写再使用

3.以内置函数iter()为例详解魔法函数的重写(自定义)
3.1首先来看iter():

在这里插入图片描述
        重点:当我们不考虑设置iter()的第2个参数时,第一个参数object必须是支持__iter__()方法的(可迭代的),也即iter()调用其__iter__()返回一个迭代器对象

3.2由迭代器对象及其方法next()来分析:

在这里插入图片描述
在这里插入图片描述
        提取重点:
1.对迭代器对象使用__next__()方法或next()方法来以此输出迭代器对象数据项
2.next()调用__next__()方法

经以上分析,我们可以得到最开始的示例代码的实际内涵了:
        1.在类中我们对__iter__()和__next__()进行了重写,这俩方法是魔法方法
        2.在对该类实例化对象使用iter()内置函数时,iter()调用我们重写的__iter__()而不是其原本的,返回self。同样的,对myiter 使用next()内置函数时也即调用我们重写的__next__()而不是原来的。

class MyNumbers:
  def __iter__(self):
    self.a = 1
    return self
 
  def __next__(self):
    x = self.a
    self.a += 1
    return x
 
myclass = MyNumbers()
myiter = iter(myclass)
 
print(next(myiter))
print(next(myiter))
print(next(myiter))
print(next(myiter))
print(next(myiter))
<think>嗯,用户问的是自定义迭代器类的__iter__方法是不是返回自己。之前他们提到过在之前的例子中,Counter类同时实现了__iter__和__next__,并且在__iter__里返回了self。现在他们可能想确认这是不是普遍的做法,或者是否有例外情况。 首先,我需要回顾迭代器基本概念。在Python中,可迭代对象(Iterable)是实现了__iter__方法的对象,而迭代器Iterator)是实现了__next__和__iter__的对象。迭代器的__iter__通常返回自己,因为迭代器本身也是可迭代的,这样可以在需要迭代器的地方直接使用。 用户可能已经知道,当使用for循环时,会先调用__iter__来获取迭代器,然后调用__next__。而直接调用next()时,不需要调用__iter__,因为对象已经是迭代器了。所以他们可能想确认,自定义迭代器类的__iter__方法是否必须返回自己,或者是否可以返回其他东西。 需要明确的是,根据Python迭代器协议,迭代器的__iter__方法应该返回自身,这样当迭代器被用于需要可迭代对象的地方时,比如在另一个for循环中,它仍然可以正常工作。如果__iter__返回了其他对象,那么那个对象必须也是一个迭代器,否则会导致错误。 可能用户还担心如果不返回自己会有什么后果。比如,如果__iter__返回了一个新的迭代器实例,那么每次调用iter()都会得到不同的迭代器,这可能导致不可预料的行为,尤其是在多次迭代同一个对象时。例如,如果有一个列表,每次调用iter(list)都返回新的迭代器,这样多个循环可以独立进行。但如果是自定义迭代器,如果__iter__不返回自己,而是每次都创建新实例,可能会破坏迭代的状态。 此外,用户可能想知道为什么有些例子中的迭代器类需要同时实现__iter__和__next__。这是因为,迭代器必须同时是可迭代的,即它们可以在for循环中使用。而可迭代对象的__iter__返回一个迭代器,所以当迭代器本身就是可迭代的时候,它的__iter__只需要返回自己,这样就能满足协议的要求。 可能还需要解释,如果自定义的迭代器类没有正确实现__iter__方法,返回自身的话,可能会导致TypeError,因为Python在for循环中会检查是否返回了一个迭代器。例如,如果__iter__返回的不是迭代器,就会出错。 总结下来,回答需要确认是的,在自定义迭代器类中,__iter__方法通常返回self,以确保符合迭代器协议,并且允许该迭代器在需要可迭代对象的上下文中被正确使用。同时,需要说明这样做的原因和必要性,以及不这样做可能带来的问题。</think>### **分步解析:为什么自定义迭代器类的 `__iter__` 方法需要返回自身** --- #### **1. 理解迭代器协议的本质** Python迭代器协议要求: - **可迭代对象(Iterable)**:需实现 `__iter__()` 方法,返回一个**迭代器对象**。 - **迭代器Iterator)**:需实现 `__next__()` 方法(用于获取下一个值)和 `__iter__()` 方法(返回自身)。 自定义迭代器类**必须同时满足这两个角色**: - 它本身是**可迭代的**(通过 `__iter__` 返回自身)。 - 它也是**迭代器**(通过 `__next__` 提供迭代逻辑)。 --- #### **2. `__iter__` 方法为何返回 `self`?** ##### **(1) 符合协议要求** - 当对象需要被迭代时(例如在 `for` 循环中),Python 会调用其 `__iter__()` 方法获取迭代器。 - 如果该对象**自身已经是迭代器**,则 `__iter__()` 只需返回自身 `self`,无需额外创建新的迭代器。 ##### **(2) 保持迭代状态的连续性** - 若 `__iter__()` 返回新对象,则每次迭代会**重置状态**(例如 `self.current` 归零)。 - **返回 `self` 能确保迭代状态的延续**,避免多次迭代时逻辑混乱。 --- #### **3. 代码验证** ##### **自定义迭代器示例** ```python class Counter: def __init__(self, limit): self.limit = limit self.current = 0 def __iter__(self): print("__iter__ 被调用") return self # 关键点:返回自身 def __next__(self): if self.current < self.limit: val = self.current self.current += 1 return val else: raise StopIteration # 使用 for 循环 counter = Counter(3) for num in counter: # 触发 __iter__ print(num) ``` **输出**: ``` __iter__ 被调用 0 1 2 ``` ##### **若 `__iter__` 不返回自身会怎样?** 假设错误实现: ```python def __iter__(self): return Counter(self.limit) # 错误:返回新实例 ``` **问题**: - 每次调用 `iter(counter)` 会生成**新迭代器**,导致 `for` 循环永远从初始状态开始。 - 若用 `next(counter)` 手动迭代,状态变化会被 `for` 循环的迭代器覆盖。 --- #### **4. 关键对比** | 场景 | 正确实现(`__iter__` 返回 `self`) | 错误实现(`__iter__` 返回新实例) | |---------------------|-------------------------------------------|-------------------------------------------| | **多次 `for` 循环** | 第二次循环无输出(状态已耗尽) | 每次循环都输出完整结果(状态独立) | | **混合 `next()` 调用** | 状态共享,操作连贯 | 状态隔离,逻辑混乱 | --- #### **5. 设计意义** - **效率优化**:避免每次迭代创建新对象。 - **状态一致性**:确保多次操作共享同一迭代进度。 - **协议兼容性**:严格遵循 Python 迭代器协议,避免运行时错误(例如 `TypeError: iter() returned non-iterator`)。 --- ### **总结** - **必须返回自身**:自定义迭代器类的 `__iter__()` 方法需返回 `self`,以同时满足可迭代对象和迭代器的双重身份。 - **核心目的**:保证迭代状态的一致性,并符合 Python 迭代器协议的设计规范。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

涛涛ALG

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值