Python迭代器和生成器

迭代器

什么是迭代器(iterator)

官方解释:迭代器是可迭代的对象,从技术上讲,在python中,迭代器是实现了迭代器协议的对象,迭代器协议是指包含魔法方法__iter__()__next__(),__iter__返回迭代器自身,__next__返回容器中的下一个值,如果容器中没有更多元素了,则抛出StopIteration异常。

什么是可迭代对象(iterable)

从python的数据类型来讲,字符串、列表、元组、字典、集合都是可迭代对象(比如可以使用for循环语句遍历这些可迭代对象的所有值,但还不能称之为迭代器,因为这些对象没有实现__next__()方法,我是这么理解的),但是这些可迭代对象是可迭代的容器(python中字符串、列表、元组、字典、集合这些都是容器对象),可以通过python内置的iter()函数获取到这些对象对应的迭代器。

所以迭代器一定是可迭代对象,而可迭代对象不一定是迭代器,但可以快速生成对应的迭代器,使用iter()方法,然后就可以使用next()方法去获取迭代的下一个值(个人理解的结论)

# 元组、列表、字符串、字典、字符串等是可迭代的对象,实现了__iter__方法,可以使用iter()函数生成一个列表迭代器
mytuple = ("c", "java", "python")
# 使用iter生成元组迭代器
myiter = iter(mytuple)
# 打印myiter,可以看到是返回的迭代器对象
print(myiter)
# 使用next()函数调用迭代器的数据
print(next(myiter))
print(next(myiter))
print(next(myiter))
# 如果下一个数据没有时会抛出StopIteration异常
print(next(myiter))

上图的运行结果

for循环迭代原理

我们通常都使用for循环去遍历可迭代对象,实际上for循环也是实现了一个迭代器,然后每次循环使用next()方法去逐个获取可迭代对象的值

可迭代对象和迭代器的相同点和区别

相同点:都可以使用for循环进行迭代

区别:普通的可迭代对象的表头指针指向第一个数据,而迭代器的表头指针则指向当前迭代到的数据位置,如果重新再迭代,那么表头指针只会往后走,不能回到初始位置

# 元组、列表、字符串、字典、字符串等是可迭代的对象,实现了__iter__方法,可以使用iter()函数生成一个列表迭代器
mytuple = ("c", "java", "python")
# 使用iter生成元组迭代器
myiter = iter(mytuple)
print(myiter)
# 元组(可迭代对象)和元组迭代器的区别:普通的可迭代对象的表头指针指向第一个数据
# 而迭代器的表头指针则指向当前迭代到的数据位置,如果重新再迭代,那么表头指针只会往后走,不能回到初始位置
print("第一次遍历元组和元组迭代器,可以看到没什么区别")
for i in mytuple:
    print(i)
for j in myiter:
    print(j)
print("第二次遍历元组和元组迭代器,元组可以正常再次遍历,而迭代器则不能")
for m in mytuple:
    print(m)
for n in myiter:
    print(n)

上面代码运行结果:

 创建迭代器

参考链接

Python 迭代器https://www.w3school.com.cn/python/python_iterators.asp

生成器

什么是生成器(generator)

在解释什么是生成器之前,先看下普通的函数调用过程:普通函数一旦被调用,那么只有在函数代码全部执行完成或者执行到return语句时,这个函数就执行结束了;如果函数一旦将控制权交还给调用者,这个函数就调用完成,那么在函数过程中定义的局部变量就无法保存。

那有没有办法让函数在退出之后还能当前的保留状态?可以使用闭包或者全局变量,但是过多的使用全局变量会污染命名空间,闭包的定义又相对复杂

那有没有一种既简单又安全的方法呢?那就是生成器

生成器是一种特殊的迭代器,从字面意思上理解,是循环计算的操作方式。在Python中,提供一种可以边循环边计算的机制。

生成器是解决使用序列存储大量数据时,内存消耗大的问题。我们可以根据存储数据的某些规律,演算为算法,在循环过程中通过计算得到,这样可以不用创建完整序列,从而大大节省占用空间

创建生成器

yield 是实现生成器方法之一,当函数使用yield方法,则该函数就成为了一个生成器。调用该函数,就等于创建了一个生成器对象。

一个生成器,主要是通过循环反复调用next()方法,直到捕获异常。具有 yield方法的函数也是一个生成器

如何定义生成器:

在函数里面使用yield代替return来返回函数的信息或数据,使得函数不是一次性执行完成,在运行到yield语句时会暂停或中断,在下一次调用从yield语句后面的语句继续执行,生成器不像列表等可迭代对象,可以把生成器看成是制作机器,每调用一次提供一个数据,并且会记住当时的状态,而列表元组这些可迭代对象则是容器,他们里面存放的是早已经准备好的所有数据,由于生成器是每次调用才生成数据,所以是不能使用index的方式进行访问的

生成器可以看成是特殊的迭代器,首先是不走回头路,其次支持next()函数

# 定义一个生成器
def counter():
    i = 0
    while i <= 5:
        yield i
        i += 1

如何使用生成器:

可以使用for循环来使用生成器

def counter():
    i = 0
    while i <= 5:
        yield i
        i += 1


print(counter())
for i in counter():
    print(i)

使用生成器创建一个斐波拉契函数:

def fibs():
    a, b = 0, 1
    # 这是一个没有结束点的序列,如果需要设置结束的话,可以在while条件那里设置
    while True:
        yield a
        a, b = b, a+b
f = fibs()
print(next(f))
print(next(f))
print(next(f))
print(next(f))

生成器表达式:

以前有学习列表推导式,字典推导式,集合推导式,为什么没有元组推导式呢?

# 生成器表达式
# 1、列表推导式,创建一个在100内既不被2整除也不被3整除的整数列表
list1 = [i for i in range(100) if i % 2 and i % 3]
print(list1)
# 2、字典推导式,创建一个在10以内,判定是否为偶数的字典
dict1 = {j: j % 2 == 0 for j in range(10)}
print(dict1)
# 3、集合推导式,创建一个10以内的数字集合
set1 = {k for k in [0, 0, 3, 4, 4, 5]}
print(set1)
# 4、生成器表达式,python没有元组推导式,因为如果用()进行推导,实际就成为了生成器表达式
gen1 = (m*m for m in range(10))
print(gen1)

上图的运行结果:

 所谓的元组推导式实际是生成器表达式,因此这也是创建生成器的方法之一

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值