什么是⽣成器
通过列表⽣成式, 我们可以直接创建⼀个列表。 但是, 受到内存限制, 列表容量肯定是有限的。 ⽽且, 创建⼀个包含100万个元素的列表, 不仅占⽤很⼤的存储空间, 如果我们仅仅需要访问前⾯⼏个元素, 那后⾯绝⼤多数元素占⽤的空间都⽩⽩浪费了。 所以, 如果列表元素可以按照某种算法推算出来, 那我们是否可以在循环的过程中不断推算出后续的元素呢? 这样就不必创建完整的list, 从⽽节省⼤量的空间。 在Python中, 这种⼀边循环⼀边计算的机制, 称为⽣成器: generator。
创建⽣成器⽅法—1
创建生成器
In [1]: g = (x for x in range(10))
In [2]: g
Out[2]: <generator object <genexpr> at 0x000001572924E570>
可以通过 next() 函数获得⽣成器的下⼀个返回值
In [3]: next(g)
Out[3]: 0
In [4]: next(g)
Out[4]: 1
⽣成器保存的是算法,每次调⽤ next(g) , 就计算出 g 的下⼀个元素的值,直到计算到最后⼀个元素,没有更多的元素时,抛出 StopIteration 的异常。
当然,这种不断调⽤ next() 很不方便,
正确的⽅法是使⽤ for 循环,因为⽣成器也是可迭代对象。 所以, 我们创建了⼀个⽣成器后, 基本上永远不会调⽤ next() ,⽽是通过 for 循环来迭代它, 并且不需要关心StopIteration 异常
可以通过 for循环打印值
In [5]: for i in g:
...: print(i)
...:
2
...
9
创建⽣成器⽅法—2
如果推算的算法⽐较复杂, ⽤类似列表⽣成式的 for 循环⽆法实现的时候, 还可以⽤函数来实现。
⽐如, 著名的斐波纳挈数列( Fibonacci) , 除第⼀个和第⼆个数外, 任意⼀个数都可由前两个数相加得到:
1, 1, 2, 3, 5, 8, 13, 21, 34, …
斐波纳挈数列⽤列表⽣成式写不出来, 但是, ⽤函数把它打印出来却很容易:
In [6]: def fib(num):
...: n = 0
...: a, b = 0, 1
...: while n < num:
...: print(b)
...: a, b = b, a + b
...: n += 1
In [7]: fib(5)
1
1
2
3
5
可以看出, fib函数实际上是定义了斐波纳挈数列的推算规则, 可以从第⼀个元素开始, 推算出后续任意的元素, 这种逻辑其实⾮常类似generator。
要把fib函数变成generator,只需要把print(b)改为yield b就可以了:
In [8]: def fib(num):
...: n = 0
...: a, b = 0, 1
...: while n < num:
...: yield b
...: a, b = b, a + b
...: n += 1
In [9]: f = fib(4)
In [10]: next(f)
Out[10]: 1
在上⾯fib 的例⼦, 我们在循环过程中不断调⽤ yield , 就会不断中断。 当然要给循环设置⼀个条件来退出循环,不然就会产⽣⼀个⽆限数列出来。 同样的, 把函数改成generator后, 我们基本上从来不会⽤ next() 来获取下⼀个返回值, ⽽是直接使⽤ for 循环来迭代:
In [11]: for i in fib(5):
...: print(i)
1
1
2
3
5
send
通过send,也可以访问生成器的值
In [32]: def fib(num):
...: n = 0
...: a, b = 0, 1
...: while n < num:
...: temp = yield b
...: print(temp)
...: a, b = b, a + b
...: n += 1
In [33]: f = fib(5)
In [34]: next(f)
Out[34]: 1
In [35]: f.send('qwer')
qwer
Out[35]: 1
In [36]: next(f)
None
Out[36]: 2
执⾏到yield时, fib函数作⽤暂时保存, 返回b的值。
当再次进行下次访问时,yield b 的返回值赋值给temp,默认为None。如果用send访问:f.send(“qwer”),则 send发送过来的值赋值给temp。
( 我理解为当执行到yield b时,将b返回然后等待信息的输入(此时可以执行其他函数或语句),如果下次用next访问,则表示没有输入;如果用send()访问则带有输入值,将输入值作为yield b的返回值赋值给temp,然后继续按照以上方式执行,直到程序结束。)
注意:如果用send方式第一次访问迭代器,则只能用f.send(None)。
总结
⽣成器是这样⼀个函数, 它记住上⼀次返回时在函数体中的位置。 对⽣成器函数的第⼆次( 或第 n 次) 调⽤跳转⾄该函数中间, ⽽上次调⽤的所有局部变量都保持不变。⽣成器不仅“记住”了它数据状态; ⽣成器还“记住”了它在流控制构造。
⽣成器的特点:
- 节约内存
- 迭代到下⼀次的调⽤时, 所使⽤的参数都是上一次所保留下的, 即是说, 在整个所有函数调⽤的参数都是上一次调⽤时保留的, ⽽不是新创建的