python中的迭代器、生成器、闭包

本文深入解析Python中的迭代器与生成器概念,包括其实现原理、应用场景及优势。从基本的迭代器协议到高级的闭包技巧,全面覆盖,帮助读者掌握高效的数据处理方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

迭代器

可迭代对象:

list, str, tuple, etc —> for … in … 遍历 —> 遍历(迭代)

迭代器协议:

对象必须提供一个next方法,执行该方法要么返回迭代中的下一选项,要么引起StopIteration异常,以终止迭代(只能往下走,不可以回退)

现在,我们就可以说,实现了迭代器协议的对象就是可迭代对象。

如何实现?

  • 通过在对象内部定义一个__iter__方法。
li = [1, 2, 3]

# for i in li:
#     print(i, end=" ")
#
# print(dir([]))
sr = 'abcd'
li_iter = li.__iter__()
# print(li_iter.__next__()) ---> next(li_iter)
print(next(li_iter))
print(li_iter.__next__())
sr_iter = sr.__iter__()
print(sr_iter.__next__())
print(sr_iter.__next__())
print(next(sr_iter))

'''
1
2
a
b
c
'''

for i in 100: # 直接报错
    print(i)

可迭代对象测试:

使用instance()来判断一个对象是否可迭代

collections

from collections import Iterable  # 使用instance()来判断一个对象是否可迭代

print(isinstance([], Iterable))
print(isinstance(str(), Iterable))
print(isinstance({}, Iterable))
print(isinstance(set(), Iterable))
print(isinstance(123, Iterable))
print(isinstance(True, Iterable))

'''
True
True
True
True
False
False
'''

自定义一个类,其可以容纳数据,测试该类的可迭代性

from collections import Iterable


class MyClass:

    def __init__(self):
        self.names = []

    def add(self, name):
        self.names.append(name)

    def __iter__(self):
        return self.names.__iter__()


my_class = MyClass()
my_class.add("Tom")
my_class.add("Jack")
my_class.add("Lucy")

print("是否可迭代对象:", isinstance(my_class, Iterable))
for tmp in my_class:
    print(tmp, end=" ")

'''
是否可迭代对象: True
Tom Jack Lucy 
'''    

回顾之前说的__iter__方法,其可以为我们提供一个迭代器。

在迭代一个可迭代对象的时候,实际上就是获取该对象提供的一个迭代器。然后通过该迭代器依次获取对象的每一个数据。

通过迭代器,迭代

print(my_class)
my_class_iter = iter(my_class)
print(my_class_iter)
print(next(my_class_iter))
print(next(my_class_iter))
print(next(my_class_iter))
print(next(my_class_iter))

for … in … 循环的本质

就是通过iter()函数获取可迭代对象的Iterable的迭代器,然后对获取到的迭代器不断调用next()方法来获取下一个值并将其赋值item,当遇到StopIteration的异常后,退出。

class test:
    def __init__(self, data=1):
        self.data = data

    def __iter__(self):
        return self

    def __next__(self):
        if self.data > 5:
            raise StopIteration
        else:
            self.data += 1
            return self.data


for i in test(2):
    print(i)
    
'''
3
4
5
6
'''  

应用场景

迭代器的核心就是通过next()函数调用返回下一个数据值。如果每次返回的数据值不是在一个已有的数据集合中读取的,而是通过程序按照一定规律计算生成。那么也就意味着可以不用依赖一个已有的数据集合,namely,无需将所有的迭代对象数据一次性缓存下来供后续使用。这样,可以节省大量的储存(内存)空间。

例:

斐波那契数列

现在我们希望通过for … in … 的方式来遍历斐波那契函数列中的前n个数。

通过迭代来实现,每次迭代都可以通过数学计算来生成下一个数。

# 两个初始值
# n,不大于n类似索引的值
class FibIterator(object):
    """斐波那契数列迭代器"""

    def __init__(self, n):
        # 记录生成的斐波那契数列的个数
        self.n = n
        # 记录当前记录的索引
        self.current_index = 0
        # 记录两个初始值
        self.num1 = 0
        self.num2 = 1

    def __next__(self):
        """调用next()函数来获取下一个数"""
        if self.current_index < self.n:
            num = self.num1
            self.num1, self.num2 = self.num2, self.num1 + self.num2
            self.current_index += 1
            return num
        else:
            raise StopIteration

    def __iter__(self):
        return self


fib = FibIterator(10)
for num in fib:
    print(num, end=" ")

# 0 1 1 2 3 5 8 13 21 34 

生成器

生成器,利用迭代器我们可以在每次迭代获取数据时(通过next()方法)按照特定的规律进行生成。但是我们在实现一个迭代器时,关于当前迭代的状态需要我们自己记录,进而才能根据当前的状态生成下一个数据。为了达到记录当前状态,并配合next()函数进行迭代使用,可以采用更简便的语法。

生成器(generator),生成器是一种特殊的迭代器,它比迭代器更优雅。

创建一个生成器

列表[ ] —> ( )

li = [x ** 2 for x in range(6)]
print(li)

gen = (x ** 2 for x in range(6))
print(gen)

print("通过next()函数取得下一个值")
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))

'''
[0, 1, 4, 9, 16, 25]
<generator object <genexpr> at 0x000002DF42E11200>
通过next()函数取得下一个值
0
1
4
9
16
25
'''

print("通过for遍历")
gen = (x ** 2 for x in range(6))
for i in gen:
    print(i, end=" ")
    
# 通过for遍历
# 0 1 4 9 16 25     

生成器函数

在函数中如果出现了yield关键字,那么该函数就不再是一个普通函数而是一个生成器函数。

例:

def foo():
    yield 1
    yield 2
    return "Error"
    yield 3


f = foo()
print(next(f))  # 程序会停留在对应yield后的语句
print(next(f))
print(next(f))  # 当程序遇到return,return后的语句不会再执行。因此报错。

'''
1
2
报错:    
print(next(f))
StopIteration: Error
'''

next 和 yield进行匹配,如果遇到return,return后面的语句就不会再执行,直接抛出StopIteration,终止迭代。

在一个生成器中如果return后面有返回值,那么这个值就是异常的说明,而不是函数的返回值。

构造一个产生无穷奇数的生成器

法一:

def odd():
    n = 1
    while True:
        yield n
        n += 2


odd_num = odd()
print(odd_num)
count = 0
for i in odd_num:
    if count > 5:
        break
    print(i)
    count += 1
    
print(next(odd_num))    
    
'''
<generator object odd at 0x0000017F97081200>
1
3
5
7
9
11
15
'''

def odd():
    n = 1
    while True:
        yield n
        n += 2


odd_num = odd()
print(odd_num)
for i in range(1, 6):
    print(next(odd_num))
    
'''
<generator object odd at 0x000002AEA7FE1200>
1
3
5
7
9
'''

def odd():
    n = 1
    while True:
        yield n
        n += 2


odd_num = odd()
print(odd_num)
print(next(odd_num))
print(next(odd_num))
print(next(odd_num))

'''
<generator object odd at 0x000002C873461200>
1
3
5
'''

法二:

class OddIter:
    def __init__(self):
        self.start = -1

    def __iter__(self):
        return self

    def __next__(self):
        self.start += 2
        return self.start


odd = OddIter()
for i in range(6):
    print(next(odd))
    
'''
1
3
5
7
9
11
'''    

通过类手动编写迭代器,实现类似的效果。

def odd():
    n = 1
    while True:
        yield n
        n += 2


odd_num = odd()
print(help(odd_num))

'''
Help on generator object:

odd = class generator(object)
 |  Methods defined here:
 |  
 |  __del__(...)
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __next__(self, /)
 |      Implement next(self).
 |  
 |  __repr__(self, /)
 |      Return repr(self).
 |  
 |  close(...)
 |      close() -> raise GeneratorExit inside generator.
 |  
 |  send(...)
 |      send(arg) -> send 'arg' into generator,
 |      return next yielded value or raise StopIteration.
 |  
 |  throw(...)
 |      throw(typ[,val[,tb]]) -> raise exception in generator,
 |      return next yielded value or raise StopIteration.
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  gi_code
 |  
 |  gi_frame
 |  
 |  gi_running
 |  
 |  gi_yieldfrom
 |      object being iterated by yield from, or None

None
'''
  • close()

    • 手动关闭生成器函数,后面调用会直接引起StopIteration
    def gen():
        yield 1
        yield 2
        yield 3
        yield 4
    
    
    g = gen()
    print(next(g))
    print(next(g))
    g.close()
    print(next(g))  # 回溯
    
    '''
    1
    2
    '''
    
  • send()

    • x = yield y 语句的含义:send()的作用就是使x赋值为其所传送的值(send的参数),然后让生成器执行到下一个yield。
    • 如果生成器未启动,则必须在使用send()前启动生成器,而启动的方法可以是gen.next(), 也可以是gen.send(None) 执行到第一个yield处。之后就可以使用send(para)不断的传入值了。
    • 如果是已启动,则send(para)的作用就是给x赋值为发送的值(send的参数),然后,让生成器执行到下一个yield。
    def gen():
        value = 0
        while True:
            receive = yield value
            if receive == "e":
                break
            value = "got : %s" % receive
    
    
    g = gen()
    print(g.send(None))
    print(g.send("aaa"))
    print(g.send(123))
    
    '''
    0
    got : aaa
    got : 123
    '''
    
def gen():
    i = 0
    while i < 5:
        temp = yield i
        print(temp)
        i += 1


# 创建生成器对象
obj = gen()
# 使用next()唤醒生成器
print(next(obj))
print(next(obj))
print(obj.send("city"))

'''
0
None
1
city
2
'''
  • throw()
    • 手动抛出异常

闭包

什么是闭包

闭是封闭(函数中的函数),包是包含(该内部函数对外部函数的作用域,而非全局作用域变量的引用)

闭包:

  • 内部函数外部函数作用域里的变量引用
  • 函数内的属性,都是有生命周期,都是在函数执行期间
  • 闭包内的闭包函数私有化了变量,完成了数据的封装,类似面向对象

例:

def foo():
    print("in foo()")

    def bar():
        print("in bar()")

# 1、直接运行内部函数报错
# bar()
# 2、考虑先运行外部函数,再运行内部函数,依然会报错
# foo()
# bar()

由于作用域的问题,函数内的属性,都是有生命周期的,只有在函数执行期间

再考虑这段代码,只有调用foo()时,内部的print()及bar()函数才能存活。

现在我们为了让foo()内的bar()存活,就是调用bar(),我们该怎么做?

把bar()函数返回给函数

def foo():
    print("in foo()")

    def bar():
        print("in bar()")

    return bar


var = foo()
var()

# in foo()
# in bar() 

前面说内部函数对外部函数作用域变量的引用,—> 如果是变量呢?

def foo():
    a = 66
    print("in foo()")

    def bar(num):
        print("in bar()")
        print(a + num)
    return bar


var = foo()
var(22)

'''
in foo()
in bar()
88
'''

def foo():
    a = 66
    print("in foo()")

    def bar(num):
        print("in bar()")
        print(a + num)

    bar(22)


var = foo()

'''
in foo()
in bar()
88
'''
li = [1, 2, 3, 4, 5]


def foo(obj):
    print("foo:", obj)

    def bar():
        obj[0] += 1
        print("bar:", obj)

    return bar


var = foo(li)
var()
var()

'''
foo: [1, 2, 3, 4, 5]
bar: [2, 2, 3, 4, 5]
bar: [3, 2, 3, 4, 5]
'''

li = [1, 2, 3, 4, 5]


def foo(obj):
    print("foo:", obj)

    def bar():
        obj[0] += 1
        print("bar:", obj)

    return bar


# 程序再执行时,foo()函数返回给了内部定义的bar()函数
foo(li)
foo(li)
var = foo(li)  # 将返回值赋值给var
var()
var()

'''
foo: [1, 2, 3, 4, 5]
foo: [1, 2, 3, 4, 5]
foo: [1, 2, 3, 4, 5]
bar: [2, 2, 3, 4, 5]
bar: [3, 2, 3, 4, 5]
'''
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值