Python中的yield

本文详细解析了Python中yield关键字的功能与应用场景,包括生成器的概念、如何使用yield实现高效迭代,以及send方法与next方法的区别。

引用(http://www.jianshu.com/p/d09778f4e055)

阅读别人的python源码时碰到了这个yield这个关键字,各种搜索终于搞懂了,在此做一下总结:

  1. 通常的for...in...循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是mylist = [1, 2, 3],也可以是mylist = [x*x for x in range(3)]。
    它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。
  2. 生成器是可以迭代的,但只可以读取它一次。因为用的时候才生成。比如 mygenerator = (x*x for x in range(3)),注意这里用到了(),它就不是数组,而上面的例子是[]。
  3. 我理解的生成器(generator)能够迭代的关键是它有一个next()方法,工作原理就是通过重复调用next()方法,直到捕获一个异常。可以用上面的mygenerator测试。
  4. 带有 yield 的函数不再是一个普通函数,而是一个生成器generator,可用于迭代,工作原理同上。
  5. yield 是一个类似 return 的关键字,迭代一次遇到yield时就返回yield后面(右边)的值。重点是:下一次迭代时,从上一次迭代遇到的yield后面的代码(下一行)开始执行。
  6. 简要理解:yield就是 return 返回一个值,并且记住这个返回的位置,下次迭代就从这个位置后(下一行)开始。
  7. 带有yield的函数不仅仅只用于for循环中,而且可用于某个函数的参数,只要这个函数的参数允许迭代参数。比如array.extend函数,它的原型是array.extend(iterable)。
  8. send(msg)与next()的区别在于send可以传递参数给yield表达式,这时传递的参数会作为yield表达式的值,而yield的参数是返回给调用者的值。——换句话说,就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10
  9. send(msg)与next()都有返回值,它们的返回值是当前迭代遇到yield时,yield后面表达式的值,其实就是当前迭代中yield后面的参数。
  10. 第一次调用时必须先next()或send(None),否则会报错,send后之所以为None是因为这时候没有上一个yield(根据第8条)。可以认为,next()等同于send(None)。

代码示例1:

#encoding:UTF-8  
def yield_test(n):  
    for i in range(n):  
        yield call(i)  
        print("i=",i)  
    #做一些其它的事情      
    print("do something.")      
    print("end.")  
  
def call(i):  
    return i*2  
  
#使用for循环  
for i in yield_test(5):  
    print(i,",")  

结果是:

>>>   
0 ,  
i= 0  
2 ,  
i= 1  
4 ,  
i= 2  
6 ,  
i= 3  
8 ,  
i= 4  
do something.  
end.  
>>> 

理解的关键在于:下次迭代时,代码从yield的下一跳语句开始执行。

代码示例2:

def node._get_child_candidates(self, distance, min_dist, max_dist):
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild

与前面不同的是,这个函数中没有for循环,但它依然可以用于迭代。
node._get_child_candidates函数中有yield,所以它变成了一个迭代器,可以用于迭代。
执行第一次迭代时(其实就是调用next()方法),如果有左节点并且距离满足要求,会执行第一个yield,这时会返回self._leftchild并完成第一个迭代。
执行第二次迭代时,从第一个yield后面开始,如果有右节点并且距离满足要求,会执行第二个yield,这时会返回self._rightchild并完成第一个迭代。
执行第三次迭代时,第二个yield后再无代码,捕获异常,退出迭代。

调用过程:

result, candidates = list(), [self]
while candidates:
    node = candidates.pop()
    distance = node._get_dist(obj)
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)
    candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))
return result

上面的node._get_child_candidates(self, distance, min_dist, max_dist)是放在extend()函数中作为参数的,为什么可以这么用,就因为extend函数的参数不仅仅支持array,只要它是一个迭代器就可以。它的原型是array.extend(iterable)。

代码示例3:

转载于:https://www.cnblogs.com/meditator/p/7940826.html

<think>嗯,用户想了解Pythonyield的用法和生成器的相关知识。首先,我需要回顾一下生成器的基本概念。生成器是一种特殊的迭代器,可以通过函数来创建,而yield关键字就是用来定义生成器的关键。用户可能已经知道普通的函数使用return返回值,但yield的不同之处在于它会暂停函数执行并保留状态,下次调用时继续执行。 接下来,我需要解释yield的工作流程。例如,当函数执行到yield语句时,会返回一个值,但不会退出函数,而是保持当前状态。下次调用next()时,函数从yield之后继续执行。这点可能需要用例子来说明,比如斐波那契数列的生成器,这样用户能更直观地理解。 然后,生成器的优势是什么?内存效率高,因为不需要一次性生成所有数据,而是按需生成。这在处理大数据时特别有用。比如,当用户需要处理一个很大的文件或者数据集时,生成器可以逐个产生数据,而不是全部加载到内存中。这可以引用用户提供的引用内容中的例子,比如sum(firstn(1000000)),说明生成器如何提升性能。 另外,用户可能想知道生成器的应用场景。比如流式处理、惰性计算、协程等。这些场景需要展开说明,让用户了解实际使用中的情况。比如,使用生成器处理日志文件,逐行读取处理,而不是一次性读入内存。 用户提供的引用中有提到生成器和迭代器的区别,可能需要对比说明。生成器是迭代器的一种,但更简洁,不需要实现__iter__和__next__方法,只需使用yield即可。引用中的斐波那契例子可以再次使用,展示生成器的简洁性。 还要注意yield的常见误区,比如函数中使用yield后,函数就变成了生成器函数,调用时返回生成器对象,而不是直接执行。这点需要强调,避免用户误解。同时,生成器只能遍历一次,之后需要重新创建,这也是需要注意的地方。 用户的问题可能涉及如何创建生成器,除了函数中使用yield,还可以用生成器表达式。比如(i for i in range(10)),和列表推导式类似,但使用圆括号。这点可能需要补充说明,以全面回答用户的问题。 最后,结合用户提供的引用内容,引用相关的部分来支持解释,比如引用[3]提到的yield类似return,但函数不会释放状态,这点需要强调。同时,引用[2]中的例子可以说明生成器在性能上的优势,比如处理大量数据时节省内存。 总结来说,回答的结构应该包括:生成器的定义、yield的工作机制、生成器的优势、应用场景、迭代器的对比、创建方式以及注意事项。通过例子和引用中的内容来增强解释的可信度,并确保语言通俗易懂,帮助用户逐步理解。</think>### Python yield 用法及生成器详解 #### 一、生成器的核心概念 生成器是一种特殊的迭代器,通过函数中的`yield`关键字实现。普通函数使用`return`不同,`yield`会**暂停函数执行并保留当前状态**,下次调用时从暂停处继续执行[^3]。 #### 二、yield 的工作机制 1. **执行流程** - 当函数执行到`yield`时,返回右侧表达式的值 - 函数状态(变量值、执行位置)被冻结 - 下次调用`next()`时,从`yield`下一行继续执行 ```python def count_down(n): while n > 0: yield n n -= 1 gen = count_down(3) print(next(gen)) # 输出 3 print(next(gen)) # 输出 2 ``` 2. **状态保持特性** 生成器函数中的局部变量在多次调用中会保持状态,而普通函数每次调用都会重新初始化变量[^3]。 #### 三、生成器的核心优势 1. **内存效率** 按需生成数据,避免一次性加载所有数据到内存。例如处理百万级数据: ```python def large_dataset(): for i in range(1_000_000): yield i * 2 ``` 此生成器仅需几十字节内存,而列表需要约8MB[^2]。 2. **惰性计算特性** 数据只有在被请求时才会生成,适合处理: - 无限序列(如斐波那契数列) - 流式数据(如日志文件实时处理) - 大数据集分块处理 #### 四、典型应用场景 1. **高效迭代器实现** ```python def fibonacci(): a, b = 0, 1 while True: yield a a, b = b, a + b fib = fibonacci() print([next(fib) for _ in range(10)]) # 输出前10项 ``` 2. **协程实现基础** `yield`可实现双向通信,是协程编程的基础: ```python def coroutine(): while True: received = yield print(f"Received: {received}") c = coroutine() next(c) # 启动协程 c.send("Hello") # 输出 Received: Hello ``` #### 五、生成器进阶用法 1. **表达式形式** 使用圆括号创建生成器表达式: ```python squares = (x*x for x in range(10)) sum(squares) # 返回 285 ``` 2. **数据管道构建** 多生成器串联实现复杂处理流程: ```python def read_lines(file): with open(file) as f: for line in f: yield line.strip() def filter_comments(lines): for line in lines: if not line.startswith('#'): yield line pipeline = filter_comments(read_lines('config.ini')) ``` #### 六、注意事项 1. **一次性特性** 生成器遍历完成后需要重新创建: ```python gen = (x for x in range(3)) list(gen) # [0,1,2] list(gen) # [] ``` 2. **异常处理** 使用`generator.close()`或`generator.throw()`管理生成器生命周期。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值