迭代器

本文深入解析迭代器和生成器的概念与应用,包括迭代器协议、自定义迭代器、生成器函数与表达式,以及它们在节省内存和延迟计算上的优势。同时,介绍了闭包装饰器的使用,展示如何在不改变函数行为的情况下增强其功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

迭代器

可迭代对象:

list,str,tuple,etc. —>for…in…遍历—>遍历(迭代)

迭代器协议:对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么引起StopIteration异常,以终止迭代(只能往下走,不可以回退)

现在我们就可以说,实现了迭代器协议的对象就是可迭代对象。

如何实现?

  • 通过在对象内部定义一个__iter__方法。
li=[1,2,3]
sr="abcd"
li_iter=li.__iter__()
print(li.__iter__())
print(sr.__iter__())
print(li_iter.__next__())
print(li_iter.__next__())
print(li_iter.__next__())
sr_iter=sr.__iter__()
print(sr_iter.__next__())
li=[x**2 for x in range(6)]
print(li)
gene=(x**2 for x in range(6))
print(gene)
#
[0, 1, 4, 9, 16, 25]
<generator object <genexpr> at 0x000001D0975B6E08>
from collections import Iterable #使用instance()来判断一个对象是否可迭代
print(isinstance([],Iterable))
print(isinstance(str(),Iterable))
print(isinstance({},Iterable))
print(isinstance(set(),Iterable))
print(isinstance(123,Iterable))
print(isinstance(True,Iterable))
#
True
True
True
True
False
False

自定义一个类,其可以容纳数据,测试该类的可迭代性。

from collections import Iterable
class MyClass:
    def __init__(self):
        self.names=[]
    def add(self,name):
        self.names.append(name)
    def __iter__(self):
        return self.names.__iter__()
my_class=MyClass()
my_class.add("tom")
my_class.add("jack")
my_class.add("lucy")
print("是否为可迭代对象:",isinstance(my_class,Iterable))
for tmp in my_class:
    print(tmp,end=" ")
#
是否为可迭代对象: True
tom jack lucy 

在访问一个可迭代对象的时候,实际上就是获取该对象提供的一个迭代器。然后通过该迭代器依次获取对象的每一个数据。

for…in…循环的本质

就是通过iter()函数获取可迭代对象的Iterable的迭代器,然后对获取到的迭代器不断调用next()方法来获取下一个值,并将其赋值,当遇到StopIteration的异常后,退出。

应用场景

迭代器的核心就是通过next()函数调用返回下一个数据值。如果每次返回的数据值不是在一个已有的数据集合中读取的,而是通过程序按照一定规律生成。那么也就意味着可以不用依赖一个已有的数据集合,namely,无需将所有的迭代对象一次性缓存下来供后续使用。这样,就可以节省大量的存储空间

demo:

斐波那契数列

现在我们希望通过for…in…的方式来遍历斐波那契数列中的前n个数。

通过迭代来实现,每次迭代都可以通过数学计算来生成下一个数。

class FibIterator(object):
    """斐波那契数列迭代器"""
    def __init__(self,n):
        #记录生成的斐波那契数列的个数
        self.n=n
        #记录当前记录的索引
        self.current_index=0
        # 记录两个初始值
        self.num1=0
        self.num2=1
    def __next__(self):
        """调用next()函数来获取下一个数"""
        if self.current_index<self.n:
            num=self.num1
            self.num1,self.num2=self.num2,self.num1+self.num2
            self.current_index+=1
            return num
        else:
            raise StopIteration
    def __iter__(self):
        return self
fib=FibIterator(10)
for num in  fib:
    print(num,end=" ")
#
0 1 1 2 3 5 8 13 21 34 

生成器

生成器,利用迭代器,我们可以在每次迭代获取数据时(通过next()方法)按照特定的规律进行生成。但是我们在实现一个迭代器的时,关于当前迭代的状态需要我们自己记录,进而才能根据当前的状态生成下一个数据。为了达到记录当前状态,并配合next()函数进行迭代使用,可以采用更简便的语法

生成器(generator),生成器是一种特殊的迭代器

创建一个生成器

列表[] —> ()

li = [x**2 for x in range(6)]
print(li)

gen = (x**2 for x in range(6))
print(gen)

print("通过next()函数取得下一个值")
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))

print("通过for遍历")

gen = (x**2 for x in range(6))
for i in gen:
    print(i, end=" ")

[0, 1, 4, 9, 16, 25]
<generator object <genexpr> at 0x000002740DF31D00>
通过next()函数取得下一个值
0
1
4
9
16
25
通过for遍历
0 1 4 9 16 25 

生成器函数

在函数中如果出现yield关键字,那么该函数就不再是一个普通函数而是一个生成器

def foo():
    yield 1
    yield 2
    return 
    yield 3

f = foo()
print(next(f))   # 程序会停留在yield后的语句
print(next(f))
print(next(f))   # 当程序遇到return,return后的语句不会再执行,报错

next和yield进行匹配,如果遇到return,return后的语句不会再执行,直接抛出异常,终止迭代

在一个生产其中,如果return后有返回值,那么这个值就是异常的说明,而不是函数的返回值

def odd():
    n = 1
    while True:
        yield n
        n += 2

odd_num = odd()
count = 0
for i in odd_num:
    if count > 5:
        break
    print(i)
    count += 1

print(next(odd_num))    # 1 3 5 7 9 11 15
print(next(odd_num))    # 17
class OddIter:

    def __init__(self):
        self.start = -1

    def __iter__(self):
        return self

    def __next__(self):
        self.start += 2
        return self.start
    
odd = OddIter()
for i in range(6):
    print(next(odd), end=" ")
    
1 3 5 7 9 11
  • close()
    • 手动关闭生成器函数,后面调用会直接引起StopIteration异常
  • send()
    • x = yield y 语句的含义:send()的作用就是使x赋值为其所传送的值(send的参数),然后让生成器执行到下一个yield
    • 如果生成器未启动,则必须在使用send()前启动生成器,而启动的方法可以是gen.next(),也可以使gen.send(None)执行到第一个yield处。之后就可以使用send(para)不断的传入值
    • 如果是已启动,则send(para)的作用就是给x赋值 为发生的值(send的参数),然后,让生成器执行到下一个yield
def gen():
    value = 0
    while True:
        receive = yield value
        if receive =="e":
            break
        value = "got: %s" % receive
        
"""send()的作用就是使receive赋值为其所传送的值,然后让生成器执行到下一个yield"""

g = gen()
print(g.send(None))    # 0
print(g.send('aaa'))   # got: aaa
def gen():
    i = 0
    while i < 5:
        temp = yield i
        print(temp)
        i += 1
        
obj = gen()
print(next(obj))
print(next(obj))
print(obj.send("city"))

0
None
1
city
2
  • throw
    • 手动抛出异常
def gen():
	i=0
	while i<5:
		temp =yield i
		print(temp)
		i+=1

#创建生成器对象
obj=gen()
#使用next()唤醒生成器
print(next(obj))
print(next(obj))
print(obj.throw(Exception,"Method throw called."))

闭包

闭是封闭(函数中的函数),包是包含(该内部函数对外部函数作用域而非全局作用域变量的引用)

闭包:

  • 内部函数对外部函数作用域里的变量的引用
  • 函数内部的属性,都是有生命周期的,都是在函数执行期间
  • 闭包内的闭包函数私有了变量,完成了数据的封装,类似面向对象

deom:

def foo():
	print("in foo()")

	def bar():
		print("in bar()")
#1.直接运行内部函数报错
#bar()

#2.考虑先运行外部函数,再运行内部函数,依然会报错
#foo()
#bar()

由于作用域的问题,函数内的属性,都是有生命周期的,只有在函数执行期间,

再考虑再这段代码,只有调用foo()时,内部的print()及bar()才能存活。

现在我们为了foo()内的bar()存活,就是调用bar(),该怎么做

把 bar()函数返回给函数

def foo():
    print("in foo()")

    def bar():
        print("in bar()")
    return bar

var = foo()    #in foo()
var()          #in bar()

前面说,内部函数对外部函数作用域变量的引用 —> 那如果是变量呢

def foo():
    a = 66
    print("in foo()")

    def bar(num):
        print("in bar()")
        print(a + num)
    return bar

var = foo()   # in foo()
var(22)       # in bar()
              # 88
li = [1, 2, 3, 4, 5]

def foo(obj):
    print("foo:", obj)

    def bar():
        obj[0] += 1
        print("bar:", obj)
    return bar
# 程序在执行时,foo()函数返回给了内部定义的bar()函数

foo(li)          # foo: [1, 2, 3, 4, 5]
foo(li)          # foo: [1, 2, 3, 4, 5]
var = foo(li)    # foo: [1, 2, 3, 4, 5]  将返回值赋值给var
var()            # bar: [2, 2, 3, 4, 5]
var()            # bar: [3, 2, 3, 4, 5]

装饰器

@func1
def func():
    print('aaa')

装饰器存在的意义

  • 不影响原有函数的功能
  • 可以添加新功能

一般常见的,比如拿到第三方的API接口,第三方不允许修改这个接口,这个时候,装饰器就派上用场

装饰器本身也是一个函数,作用是为现有存在的函数,在不改变函数的基础上,增加一些功能进行装饰

他是以闭包的方式去实现的

在使用装饰器函数时,在被装饰的函数的前一行,使用@装饰器函数名形式来进行装饰

demo:

在一个项目中,有很多函数,由于项目越来越大,功能越来越多,导致程序越来越慢

其中一个功能函数的功能,是实现一百万次的累加:

def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

假如要计算函数的运行时间:

import time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)
    
start = time.time()
my_count()
end = time.time()

print('执行时间为:', (end - start))

# sum: 500000500000
# 执行时间为: 0.10372257232666016

考虑将上述代码中的时间计算封装为函数:

import time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)


def count_time(func):
    start = time.time()
    func()
    end = time.time()
    print('执行时间为:', (end - start))

count_time(my_count)

在不影响原函数的同时

import time
def count_time(func):
    def wrapper():
        start = time.time()
        func()
        end = time.time()
        print('执行时间为:', (end - start))
    return wrapper

def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

my_count = count_time(my_count)
my_count()

在使用时,让my_count函数重新指向count_time函数返回的函数使用。这样使用my_count时,就和原来的使用方式一样了

实现就用装饰器

import time

def count_time(func):
    def wrapper():
        start = time.time()
        func()
        end = time.time()
        print('执行时间为:', (end - start))
    return wrapper

@count_time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

my_count()

这样实现的好处,定义闭包函数后,只需要通过@装饰器函数名形式的装饰器语法,就可以将@装饰器函数名加到要装饰的函数前即可

这种不改变原有函数功能,对函数进行扩展的形式,就称为装饰器


在使用时,让my_count函数重新指向count_time函数返回的函数使用。这样使用my_count时,就和原来的使用方式一样了

实现就用装饰器

```python
import time

def count_time(func):
    def wrapper():
        start = time.time()
        func()
        end = time.time()
        print('执行时间为:', (end - start))
    return wrapper

@count_time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

my_count()

这样实现的好处,定义闭包函数后,只需要通过@装饰器函数名形式的装饰器语法,就可以将@装饰器函数名加到要装饰的函数前即可

这种不改变原有函数功能,对函数进行扩展的形式,就称为装饰器

在执行@装饰器函数名时,就是将原函数传递到闭包中。然后,原函数的引用指向闭包返回的装饰过的内部函数的引用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值