在 Python 中,**generator(生成器)**是一种特殊的迭代器类型。
生成器可以通过两种方式创建:
一是使用函数中的yield关键字,
二是使用生成器表达式
python生成器:
惰性求值:生成器不会一次性生成所有的值,而是在需要的时候逐个生成值,这对于处理大量数据或无限序列非常有用,可以节省内存。
只能迭代一次:一旦生成器被迭代完毕,就不能再次从头开始迭代。
支持迭代协议:可以使用for循环进行迭代,也可以使用next()函数逐个获取值。
生成器表达式的示例:
gen_exp = (i for i in range(5))
这里的gen_exp也是一个生成器对象。生成器表达式与列表推导式类似,但它返回的是一个生成器而不是一个列表
以下是一个在 Python 中使用生成器并用for循环迭代以及用next()获取值的例子
# 定义一个生成器函数
def my_generator():
yield 'First value'
yield 'Second value'
yield 'Third value'
# 创建生成器对象
gen = my_generator()
# 使用 for 循环迭代生成器
print("Using for loop:")
for value in gen:
print(value)
# 再次创建生成器对象,因为前面的迭代已耗尽生成器
gen = my_generator()
# 使用 next() 函数获取值
print("\nUsing next():")
print(next(gen))
print(next(gen))
print(next(gen))
# 尝试再次调用 next() 会引发 StopIteration 异常
try:
print(next(gen))
except StopIteration:
print("Reached end of generator.")
结果区域
Using for loop:
First value
Second value
Third value
Using next():
First value
Second value
Third value
Reached end of generator.
进程已结束,退出代码为 0
阅读别人的python源码时碰到了这个yield这个关键字,各种搜索终于搞懂了,在此做一下总结:
- 通常的for…in…循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是mylist = [1, 2, 3],也可以是mylist = [x*x for x in range(3)]。 它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。
- 生成器是可以迭代的,但只可以读取它一次。因为用的时候才生成。比如 mygenerator = (x*x for x in range(3)),注意这里用到了(),它就不是数组,而上面的例子是[]。
- 我理解的生成器(generator)能够迭代的关键是它有一个next()方法,工作原理就是通过重复调用next()方法,直到捕获一个异常。可以用上面的mygenerator测试。
- 带有 yield 的函数不再是一个普通函数,而是一个生成器generator,可用于迭代,工作原理同上。
- yield 是一个类似 return 的关键字,迭代一次遇到yield时就返回yield后面的值。重点是:下一次迭代时,从上一次迭代遇到的yield后面的代码开始执行。
- 简要理解:yield就是 return 返回一个值,并且记住这个返回的位置,下次迭代就从这个位置后开始。
- 带有yield的函数不仅仅只用于for循环中,而且可用于某个函数的参数,只要这个函数的参数允许迭代参数。比如array.extend函数,它的原型是array.extend(iterable)。
- send(msg)与next()的区别在于send可以传递参数给yield表达式,这时传递的参数会作为yield表达式的值,而yield的参数是返回给调用者的值。——换句话说,就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10
- send(msg)与next()都有返回值,它们的返回值是当前迭代遇到yield时,yield后面表达式的值,其实就是当前迭代中yield后面的参数。
- 第一次调用时必须先next()或send(None),否则会报错,send后之所以为None是因为这时候没有上一个yield(根据第8条)。可以认为,next()等同于send(None)。