迭代器

最新推荐文章于 2024-10-30 17:22:56 发布

fluflu4396

最新推荐文章于 2024-10-30 17:22:56 发布

阅读量195

点赞数 1

CC 4.0 BY-SA版权

分类专栏：学习

本文链接：https://blog.youkuaiyun.com/fluflu4396/article/details/97814712

学习专栏收录该内容

18 篇文章

订阅专栏

本文深入解析迭代器和生成器的概念与应用，包括迭代器协议、自定义迭代器、生成器函数与表达式，以及它们在节省内存和延迟计算上的优势。同时，介绍了闭包装饰器的使用，展示如何在不改变函数行为的情况下增强其功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

迭代器

迭代器

可迭代对象：

list,str,tuple,etc. —>for…in…遍历—>遍历(迭代)

迭代器协议：对象必须提供一个next方法，执行该方法要么返回迭代中的下一项，要么引起StopIteration异常，以终止迭代(只能往下走，不可以回退)

现在我们就可以说，实现了迭代器协议的对象就是可迭代对象。

如何实现？

通过在对象内部定义一个__iter__方法。

li=[1,2,3]
sr="abcd"
li_iter=li.__iter__()
print(li.__iter__())
print(sr.__iter__())
print(li_iter.__next__())
print(li_iter.__next__())
print(li_iter.__next__())
sr_iter=sr.__iter__()
print(sr_iter.__next__())

li=[x**2 for x in range(6)]
print(li)
gene=(x**2 for x in range(6))
print(gene)
#
[0, 1, 4, 9, 16, 25]
<generator object <genexpr> at 0x000001D0975B6E08>

from collections import Iterable #使用instance()来判断一个对象是否可迭代
print(isinstance([],Iterable))
print(isinstance(str(),Iterable))
print(isinstance({},Iterable))
print(isinstance(set(),Iterable))
print(isinstance(123,Iterable))
print(isinstance(True,Iterable))
#
True
True
True
True
False
False

自定义一个类，其可以容纳数据，测试该类的可迭代性。

from collections import Iterable
class MyClass:
    def __init__(self):
        self.names=[]
    def add(self,name):
        self.names.append(name)
    def __iter__(self):
        return self.names.__iter__()
my_class=MyClass()
my_class.add("tom")
my_class.add("jack")
my_class.add("lucy")
print("是否为可迭代对象：",isinstance(my_class,Iterable))
for tmp in my_class:
    print(tmp,end=" ")
#
是否为可迭代对象： True
tom jack lucy

在访问一个可迭代对象的时候，实际上就是获取该对象提供的一个迭代器。然后通过该迭代器依次获取对象的每一个数据。

for…in…循环的本质

就是通过iter()函数获取可迭代对象的Iterable的迭代器，然后对获取到的迭代器不断调用next()方法来获取下一个值，并将其赋值，当遇到StopIteration的异常后，退出。

应用场景

迭代器的核心就是通过next()函数调用返回下一个数据值。如果每次返回的数据值不是在一个已有的数据集合中读取的，而是通过程序按照一定规律生成。那么也就意味着可以不用依赖一个已有的数据集合，namely，无需将所有的迭代对象一次性缓存下来供后续使用。这样，就可以节省大量的存储空间

demo：

斐波那契数列

现在我们希望通过for…in…的方式来遍历斐波那契数列中的前n个数。

通过迭代来实现，每次迭代都可以通过数学计算来生成下一个数。

class FibIterator(object):
    """斐波那契数列迭代器"""
    def __init__(self,n):
        #记录生成的斐波那契数列的个数
        self.n=n
        #记录当前记录的索引
        self.current_index=0
        # 记录两个初始值
        self.num1=0
        self.num2=1
    def __next__(self):
        """调用next()函数来获取下一个数"""
        if self.current_index<self.n:
            num=self.num1
            self.num1,self.num2=self.num2,self.num1+self.num2
            self.current_index+=1
            return num
        else:
            raise StopIteration
    def __iter__(self):
        return self
fib=FibIterator(10)
for num in  fib:
    print(num,end=" ")
#
0 1 1 2 3 5 8 13 21 34

生成器

生成器，利用迭代器，我们可以在每次迭代获取数据时（通过next（）方法）按照特定的规律进行生成。但是我们在实现一个迭代器的时，关于当前迭代的状态需要我们自己记录，进而才能根据当前的状态生成下一个数据。为了达到记录当前状态，并配合next()函数进行迭代使用，可以采用更简便的语法

即生成器（generator），生成器是一种特殊的迭代器

创建一个生成器

列表[] —> ()

li = [x**2 for x in range(6)]
print(li)

gen = (x**2 for x in range(6))
print(gen)

print("通过next（）函数取得下一个值")
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))

print("通过for遍历")

gen = (x**2 for x in range(6))
for i in gen:
    print(i, end=" ")

[0, 1, 4, 9, 16, 25]
<generator object <genexpr> at 0x000002740DF31D00>
通过next（）函数取得下一个值
0
1
4
9
16
25
通过for遍历
0 1 4 9 16 25

生成器函数

在函数中如果出现yield关键字，那么该函数就不再是一个普通函数而是一个生成器

def foo():
    yield 1
    yield 2
    return 
    yield 3

f = foo()
print(next(f))   # 程序会停留在yield后的语句
print(next(f))
print(next(f))   # 当程序遇到return，return后的语句不会再执行，报错

next和yield进行匹配，如果遇到return，return后的语句不会再执行，直接抛出异常，终止迭代

在一个生产其中，如果return后有返回值，那么这个值就是异常的说明，而不是函数的返回值

def odd():
    n = 1
    while True:
        yield n
        n += 2

odd_num = odd()
count = 0
for i in odd_num:
    if count > 5:
        break
    print(i)
    count += 1

print(next(odd_num))    # 1 3 5 7 9 11 15
print(next(odd_num))    # 17

class OddIter:

    def __init__(self):
        self.start = -1

    def __iter__(self):
        return self

    def __next__(self):
        self.start += 2
        return self.start
    
odd = OddIter()
for i in range(6):
    print(next(odd), end=" ")
    
1 3 5 7 9 11

close()
- 手动关闭生成器函数，后面调用会直接引起StopIteration异常
send()
- x = yield y 语句的含义：send（）的作用就是使x赋值为其所传送的值（send的参数），然后让生成器执行到下一个yield
- 如果生成器未启动，则必须在使用send（）前启动生成器，而启动的方法可以是gen.next()，也可以使gen.send(None)执行到第一个yield处。之后就可以使用send(para)不断的传入值
- 如果是已启动，则send（para）的作用就是给x赋值为发生的值（send的参数），然后，让生成器执行到下一个yield

def gen():
    value = 0
    while True:
        receive = yield value
        if receive =="e":
            break
        value = "got: %s" % receive
        
"""send()的作用就是使receive赋值为其所传送的值，然后让生成器执行到下一个yield"""

g = gen()
print(g.send(None))    # 0
print(g.send('aaa'))   # got: aaa

def gen():
    i = 0
    while i < 5:
        temp = yield i
        print(temp)
        i += 1
        
obj = gen()
print(next(obj))
print(next(obj))
print(obj.send("city"))

0
None
1
city
2

throw
- 手动抛出异常

def gen():
	i=0
	while i<5:
		temp =yield i
		print(temp)
		i+=1

#创建生成器对象
obj=gen()
#使用next()唤醒生成器
print(next(obj))
print(next(obj))
print(obj.throw(Exception,"Method throw called."))

闭包

闭是封闭（函数中的函数），包是包含（该内部函数对外部函数作用域而非全局作用域变量的引用）

闭包：

内部函数对外部函数作用域里的变量的引用
函数内部的属性，都是有生命周期的，都是在函数执行期间
闭包内的闭包函数私有了变量，完成了数据的封装，类似面向对象

deom：

def foo():
	print("in foo()")

	def bar():
		print("in bar()")
#1.直接运行内部函数报错
#bar()

#2.考虑先运行外部函数，再运行内部函数，依然会报错
#foo()
#bar()

由于作用域的问题，函数内的属性，都是有生命周期的，只有在函数执行期间，

再考虑再这段代码，只有调用foo（）时，内部的print（）及bar（）才能存活。

现在我们为了foo（）内的bar（）存活，就是调用bar（），该怎么做

把 bar（）函数返回给函数

def foo():
    print("in foo()")

    def bar():
        print("in bar()")
    return bar

var = foo()    #in foo()
var()          #in bar()

前面说，内部函数对外部函数作用域变量的引用 —> 那如果是变量呢

def foo():
    a = 66
    print("in foo()")

    def bar(num):
        print("in bar()")
        print(a + num)
    return bar

var = foo()   # in foo()
var(22)       # in bar()
              # 88

li = [1, 2, 3, 4, 5]

def foo(obj):
    print("foo:", obj)

    def bar():
        obj[0] += 1
        print("bar:", obj)
    return bar
# 程序在执行时，foo（）函数返回给了内部定义的bar（）函数

foo(li)          # foo: [1, 2, 3, 4, 5]
foo(li)          # foo: [1, 2, 3, 4, 5]
var = foo(li)    # foo: [1, 2, 3, 4, 5]  将返回值赋值给var
var()            # bar: [2, 2, 3, 4, 5]
var()            # bar: [3, 2, 3, 4, 5]

装饰器

@func1
def func():
    print('aaa')

装饰器存在的意义

不影响原有函数的功能
可以添加新功能

一般常见的，比如拿到第三方的API接口，第三方不允许修改这个接口，这个时候，装饰器就派上用场

装饰器本身也是一个函数，作用是为现有存在的函数，在不改变函数的基础上，增加一些功能进行装饰

他是以闭包的方式去实现的

在使用装饰器函数时，在被装饰的函数的前一行，使用@装饰器函数名形式来进行装饰

demo：

在一个项目中，有很多函数，由于项目越来越大，功能越来越多，导致程序越来越慢

其中一个功能函数的功能，是实现一百万次的累加：

def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

假如要计算函数的运行时间：

import time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)
    
start = time.time()
my_count()
end = time.time()

print('执行时间为:', (end - start))

# sum: 500000500000
# 执行时间为: 0.10372257232666016

考虑将上述代码中的时间计算封装为函数：

import time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)


def count_time(func):
    start = time.time()
    func()
    end = time.time()
    print('执行时间为:', (end - start))

count_time(my_count)

在不影响原函数的同时

import time
def count_time(func):
    def wrapper():
        start = time.time()
        func()
        end = time.time()
        print('执行时间为:', (end - start))
    return wrapper

def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

my_count = count_time(my_count)
my_count()

在使用时，让my_count函数重新指向count_time函数返回的函数使用。这样使用my_count时，就和原来的使用方式一样了

实现就用装饰器

import time

def count_time(func):
    def wrapper():
        start = time.time()
        func()
        end = time.time()
        print('执行时间为:', (end - start))
    return wrapper

@count_time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

my_count()

这样实现的好处，定义闭包函数后，只需要通过@装饰器函数名形式的装饰器语法，就可以将@装饰器函数名加到要装饰的函数前即可

这种不改变原有函数功能，对函数进行扩展的形式，就称为装饰器


在使用时，让my_count函数重新指向count_time函数返回的函数使用。这样使用my_count时，就和原来的使用方式一样了

实现就用装饰器

```python
import time

def count_time(func):
    def wrapper():
        start = time.time()
        func()
        end = time.time()
        print('执行时间为:', (end - start))
    return wrapper

@count_time
def my_count():
    s = 0
    for i in range(1000001):
        s += i
    print("sum:", s)

my_count()

这样实现的好处，定义闭包函数后，只需要通过@装饰器函数名形式的装饰器语法，就可以将@装饰器函数名加到要装饰的函数前即可

这种不改变原有函数功能，对函数进行扩展的形式，就称为装饰器

在执行@装饰器函数名时，就是将原函数传递到闭包中。然后，原函数的引用指向闭包返回的装饰过的内部函数的引用