Python yield from 用法详解

本文深入解析Python中的yieldfrom语法,探讨其如何简化生成器的内层for循环,以及如何在生成器之间建立双向通道,实现复杂的嵌套序列扁平化和树结构遍历。同时,文章还介绍了yieldfrom在异步编程中的应用。
该文章已生成可运行项目,

yield from是Python3.3新出现的句法

替代内层for循环

如果生成器函数需要产出另一个生成器生成的值,传统的解决方法是使用嵌套的for循环:

 

>>> def chain(*iterables):
...     for it in iterables:
...         for i in it:
...             yield i
>>> s = 'ABC'
>>> t = tuple(range(3))
>>> list(chain(s, t))
['A', 'B', 'C', 0, 1, 2]

chain 生成器函数把操作依次交给接收到的各个可迭代对象处理。

 

Python3.3之后引入了新语法:
>>> def chain(*iterables):
...     for i in iterables:
...         yield from i
...
>>> list(chain(s, t))
['A', 'B', 'C', 0, 1, 2]
  • yield from 完全代替了内层的 for 循环。
  • yield from x 表达式对 x 对象所做的第一件事是,调用 iter(x),从中获取迭代器。因
    此,x 可以是任何可迭代的对象。
  • 在这个示例中使用 yield from代码读起来更顺畅,不过感觉更像是语法糖。

上面这个例子看上去比较简单(传统意义上说因为我们只是for循环一次就完事,因为只嵌套了一层),我们再来看几个yield from的例子。
例子1:我们有一个嵌套型的序列,想将它扁平化处理为一列单独的值。

 

from collections import Iterable

def flatten(items, ignore_types=(str, bytes)):
    for x in items:
        if isinstance(x, Iterable) and not isinstance(x, ignore_types):
            yield from flatten(x)
        else:
            yield x

items = [1, 2, [3, 4, [5, 6], 7], 8]
for x in flatten(items):
    print(x)
# output:
 1 2 3 4 5 6 7 8
-----------------------------------------------
items = ['Dave', 'Paula', ['Thomas', 'Lewis']]
for x in flatten(items):
    print(x)

# output:
Dave
Paula
Thomas
Lewis
  • collections.Iterable是一个抽象基类,我们用isinstance(x, Iterable)检查某个元素是否是可迭代的.如果是的话,那么就用yield from将这个可迭代对象作为一种子例程进行递归。最终返回结果就是一个没有嵌套的单值序列了。
  • 代码中额外的参数ignore types和检测语句isinstance(x, ignore types)用来将字符
    串和字节排除在可迭代对象外,防止将它们再展开成单个的字符。
  • 如果这里不用yield from的话,那么就需要另外一个for来嵌套,并不是一种优雅的操作

例子2:利用一个Node类来表示树结构

 

class Node:
    def __init__(self, value):
        self._value = value
        self._children = []

    def __repr__(self):
        return 'Node({!r})'.format(self._value)

    def add_child(self, node):
        self._children.append(node)

    def __iter__(self):
        return iter(self._children)

    def depth_first(self):
        yield self
        for c in self:
            yield from c.depth_first()


if __name__ == '__main__':
    root = Node(0)
    child1 = Node(1)
    child2 = Node(2)
    root.add_child(child1)
    root.add_child(child2)
    child1.add_child(Node(3))
    child1.add_child(Node(4))
    child2.add_child(Node(5))
    for ch in root.depth_first():
        print(ch)
  • __iter__代表一个Pyton的迭代协议,返回一个迭代器对象,就能迭代了
  • depth_frist返回一个生成器,仔细体会其中的yieldyield from用法

上面两个例子无论是树还是嵌套序列,都比较复杂,观察这里yield from跟的是什么,跟的是函数,生成器函数,而且都是在函数内递归。虽然我也不是理解的很透彻 =,= 。但现在应该知道,这是yield from一种常用的方法了(认真体会,手动滑稽)。

打开双通道

如果 yield from 结构唯一的作用是替代产出值的嵌套 for 循环,这个结构很有可能不会添加到 Python 语言中。yield from 结构的本质作用无法通过简单的可迭代对象说明,而要发散思维,使用嵌套的生成器。
yield from 的主要功能是打开双向通道,把最外层的调用方与最内层的子生成器连接起来,这样二者可以直接发送和产出值,还可以直接传入异常,而不用在位于中间的协程中添加大量处理异常的样板代码。有了这个结构,协程可以通过以前不可能的方式委托职责。
这里有张详细图来说明三者关系:http://flupy.org/resources/yield-from.pdf

caller,delegating generator and downstream generator


这里只是大概展示下三者关系,具体的内容可以去上面那个网址仔细观察。
例子就不展开了,有兴趣的童鞋可以去 Fluent Python这本书上 查看 示例16-17。并且结合示例图好好体会(我也有待好好体会)

 

总结:

  1. yield from常用来代替内层for循环 与 打开双通道
  2. 但是大部分情况下yield from并不单独使用,而是伴随着asyncio库使用,实现异步操作(一异步操作后面讲)
  3. 从Python 3.5开始引入了新的语法 asyncawait ,而await替代的就是yield from(为了不与实现内层for循环的yield from误解)

参考资料

David beazley协程
Fluent Python
Python Cookbook

 

本文章已经生成可运行项目
<think>我们被要求详细解析Pythonyield关键字的用法。根据引用材料,yield关键字用于创建生成器(generator),它可以将一个普通函数转变为生成器函数。生成器函数在执行时会产生一个序列的值,但不会一次性计算出所有值,而是每次产生一个值,并在产生值的位置暂停,直到下一次请求值(通过next()或send()等方法)时继续执行。 主要特点: 1. 生成器函数在调用时返回一个生成器对象,而不立即执行函数体。 2. 当使用next()函数或生成器的__next__()方法时,函数开始执行直到遇到yield表达式,然后返回yield后面的值,并暂停(保存所有局部变量状态)。 3. 下次调用next()时,函数从上次暂停的位置继续执行,直到再次遇到yield。 4. 如果函数执行结束(遇到return或执行到末尾),会抛出StopIteration异常。 此外,yield还可以与send()方法配合使用,允许从外部向生成器发送一个值,这个值将成为yield表达式的结果(代替None)。注意,第一次调用生成器时,必须使用next()或send(None)来启动生成器,因为此时生成器函数在开始处,还没有遇到yield来接收外部值。 根据引用[3]和[4]中的说明,我们可以通过示例来详细说明。 步骤: 1. 定义一个生成器函数,使用yield产生值。 2. 获取生成器对象。 3. 使用next()或send(None)启动生成器,运行到第一个yield处停止。 4. 之后可以使用next()继续执行,或者使用send(value)向生成器发送值(此时生成器内部yield表达式将返回这个值)。 我们通过一个例子来演示: 例子1:基本用法 ```python def simple_generator(): yield 1 yield 2 yield 3 # 创建生成器对象 gen = simple_generator() print(next(gen)) # 输出:1 print(next(gen)) # 输出:2 print(next(gen)) # 输出:3 # 再调用next(gen)会抛出StopIteration ``` 例子2:使用send()方法 ```python def generator_with_send(): print("启动") x = yield '第一次yield' # 这里yield返回一个字符串,然后暂停。当使用send时,x将获得send传入的值 print("收到:", x) y = yield '第二次yield' print("收到:", y) yield '结束' gen = generator_with_send() # 启动生成器,必须先用None启动,因为此时还没有yield表达式来接收值 value1 = next(gen) # 或者 gen.send(None) print(value1) # 输出:'第一次yield' # 发送一个值给生成器,并获取下一个yield的值 value2 = gen.send(100) # 此时,生成器内部x=100,然后执行到下一个yield,返回'第二次yield' print(value2) # 输出:'第二次yield' # 再发送一个值 value3 = gen.send(200) # 此时,生成器内部y=200,然后执行到下一个yield,返回'结束' print(value3) # 输出:'结束' # 继续调用next()将抛出StopIteration,因为函数已经执行完毕 ``` 注意:第一次启动生成器时,只能使用next()或send(None),因为此时生成器函数刚开始执行,还没有遇到yield表达式来接收外部值。如果直接使用send(非None值)会报错(TypeError)。 此外,生成器还可以使用throw()方法在暂停的位置抛出异常,以及使用close()方法关闭生成器。这些高级用法在此不做详细展开。 总结yield关键字的优点: 1. 延迟计算:只在需要时生成值,节省内存(尤其适用于大数据或无限序列)。 2. 状态保持:生成器函数在暂停时能保存函数的整个执行环境(局部变量等)。 3. 简化代码:相对于迭代器类(需要实现__iter__和__next__方法),生成器的写法更简洁。 根据引用[2]和[5],yield使得函数变成生成器,从而获得了迭代能力,代码简洁且执行流程清晰。 相关问题: 1. yield和return有什么区别? 2. 如何捕获生成器结束的StopIteration异常? 3. 生成器表达式和列表推导式有什么区别? 4. 在生成器函数中,return语句有什么作用? 5. yield from语法有什么作用? 注意:以上问题仅为示例,实际生成的相关问题应基于回答内容。 </think>### Python yield关键字用法详细解析 `yield`是Python中的核心关键字,用于创建**生成器函数**(generator function)。它允许函数在运行中暂停/恢复状态,实现延迟计算和高效的内存利用。 #### 一、核心概念 1. **生成器本质** 使用`yield`的函数会返回一个生成器对象(迭代器),而非普通返回值: ```python def gen_func(): yield 1 yield 2 gen = gen_func() # <generator object at 0x...> ``` 2. **执行流程** - 首次调用`next(gen)`:从函数起点执行到第一个`yield`,返回产出值后**暂停** - 后续调用`next(gen)`:从上个`yield`之后继续执行,直到遇到下一个`yield` - 结束时抛出`StopIteration`异常 #### 二、关键特性与用法 1. **基本产出值** ```python def count_down(n): while n > 0: yield n n -= 1 for num in count_down(3): print(num) # 输出: 3 → 2 → 1 ``` 2. **双向通信** 通过`.send(value)`向生成器传递数据(`yield`表达式接收值): ```python def accumulator(): total = 0 while True: num = yield total # yield接收send()的值 total += num gen = accumulator() next(gen) # 初始化 → 返回0 print(gen.send(5)) # 输出: 5(total=0+5) print(gen.send(3)) # 输出: 8(total=5+3) ``` 3. **自动迭代** 生成器可直接用于`for`循环: ```python def fibonacci(n): a, b = 0, 1 for _ in range(n): yield a a, b = b, a + b print(list(fibonacci(5))) # [0, 1, 1, 2, 3] ``` 4. **资源高效性** 对比列表生成式,生成器**惰性计算**,内存占用恒定: ```python # 生成1亿个数的平方(仅需几十字节内存) gen = (x*x for x in range(10**8)) # 生成器表达式 ``` #### 三、进阶用法 1. **协程实现** 结合`yield`可实现轻量级并发: ```python def task(name): print(f"{name} start") yield # 首次暂停 print(f"{name} end") t1, t2 = task("A"), task("B") next(t1) # A start next(t2) # B start next(t1) # A end ``` 2. **`yield from`委托** 简化嵌套生成器: ```python def chain(*iterables): for it in iterables: yield from it # 等价于 for i in it: yield i list(chain("AB", [1,2])) # ['A','B',1,2] ``` 3. **异常处理** 通过`.throw()`注入异常: ```python def catcher(): try: yield "Ready" except ValueError: yield "Handled!" gen = catcher() next(gen) # Ready gen.throw(ValueError) # Handled! ``` #### 四、注意事项 1. **初始化要求** 首次必须用`next(gen)`或`gen.send(None)`启动生成器(不能直接`send(值)`)[^3] 2. **状态唯一性** 生成器对象为**单次使用**,耗尽后再次调用会抛出`StopIteration` 3. **与`return`对比** | 特性 | `return` | `yield` | |------------|---------------------------|-----------------------------| | 返回值类型 | 单个对象 | 生成器对象 | | 内存占用 | 需存储所有结果 | 仅存储当前状态 | | 执行特点 | 一次性退出函数 | 多次暂停/恢复 | #### 五、典型应用场景 1. 处理大型数据集(如文件逐行读取) 2. 无限序列生成(如实时数据流) 3. 状态机实现 4. 异步编程基础(在`asyncio`底层使用) > Python的`yield`实现了**协程**的核心机制,是高效处理流式数据和并发任务的基石[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值