Python小知识点——生成器(generator)与关键字yield的运用

本文深入探讨Python生成器的概念,解释如何通过列表生成式创建生成器,以及关键字yield的作用。文章详细阐述了生成器的工作原理,包括其节省内存的优势和只能遍历一次的特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

生成器(generator)是一种可迭代对象。

在处理包含大量数据时,如果使用list来进行操作,会导致内存占用大,效率低。生成器通过延迟计算,实现了一种边循环边计算的可能,只有在需要的时候才返回相应的结果,而不是一次性返回一整个结果列表,因此可以有效地节省了大量的空间。

首先,根据列表生成式,将[]改成()即可创建一个generator

>>> a = (x * x for x in [1,2,3])  # 列表生成式:a = [x * x for x in [1,2,3]]

# 如果你想转成list类型,可以直接用list(a)。

输出元素,可以使用next()

>>> next(a)
1
>>> next(a)
4
>>> next(a)
9

每一次调用next(a),a就会接着上一次的循环输出下一次的结果。当循环完全部元素后,再调用next(a),就会报错。

另外,因为生成器本身是可迭代对象,所以你也可以使用for in 循环遍历直接输出结果。

>>> for x in a:
	print(x)	
1
4
9

对生成器有了初步认识后,我们就可以开始掌握关键字yield了。

其实很简单,关键字yield的作用就是替代关键字return,如果一个函数中使用了yield来返回结果,我们就认为这个函数是一个生成器

def func(n):
    for i in range(1,n):
        result = i * i
        yield result

# 将(x * x for x in [1,2,3])用函数的方式表示

了解生成器(generator)与关键字yield的知识后

我们将上面的代码扩展一下

def func(n):
    for i in range(1,n):
        result = i * i
        yield result

func = func(5)
for x in func:
    print(x)
for x in func:
    print(x)

运行结果:

>>> 
1
4
9
16

结果可知,本应该输出了两次循环的结果,却只输出了一次循环。如果你在两个循环中间,添加一个print(list(func))语句,你就会发现由generator转换成list的func是空的,即func=[],func内部的元素似乎被“清空”了。

注意:一个生成器只能遍历一次。

为什么会这样呢?其实在调用next()方法的时候就大概明白了,每一次调用next()的时候,循环处于“工作”状态,不调用的时候,程序就处于一种“暂停”的状态,直到再次被调用,才会“工作”。当循环到最后一个元素后,我们再调用next()时就会报错。这说明了生成器只是代表了一次完整的循环中不断计算结果的过程。

那如果你还是希望能让你的生成器能被多次调用的话,你可以这样做

1、将生成器转换成list,再进行遍历

func = list(func(5))

2、需要遍历几次,就生成多少个可迭代对象(generator),再分别遍历

func1 = list(func(5))
func2 = list(func(5))
众所周知,随机数是任何一种编程语言最基本的特征之一。而生成随机数的基本方式也是相同的:产生一个0到1之间的随机数。看似简单,但有时我们也会忽略了一些有趣的功能。 我们从书本上学到什么? 最明显的,也是直观的方式,在Java生成随机数只要简单的调用: 1.java.lang.Math.random() 在所有其他语言中,生成随机数就像是使用Math工具类,如abs, pow, floor, sqrt和其他数学函数。大多数人通过书籍、教程和课程来了解这个类。一个简单的例子:从0.0到1.0之间可以生成一个双精度浮点数。那么通过上面的信息,开发人员要产生0.0和10.0之间的双精度浮点数会这样来写: 1.Math.random() * 10 而产生0和10之间的整数,则会写成: 1.Math.round(Math.random() * 10) 进阶 通过阅读Math.random()的源码,或者干脆利用IDE的自动完成功能,开发人员可以很容易发现,java.lang.Math.random()使用一个内部的随机生成对象 - 一个很强大的对象可以灵活的随机产生:布尔值、所有数字类型,甚至是高斯分布。例如: 1.new java.util.Random().nextInt(10) 它有一个缺点,就是它是一个对象。它的方法必须是通过一个实例来调用,这意味着必须先调用它的构造函数。如果在内存充足的情况下,像上面的表达式是可以接受的;但内存不足时,就会带来问题。 一个简单的解决方案,可以避免每次需要生成一个随机数时创建一个新实例,那就是使用一个静态类。猜你可能想到了java.lang.Math,很好,我们就是改良java.lang.Math的初始化。虽然这个工程量低,但你也要做一些简单的单元测试来确保其不会出错。 假设程序需要生成一个随机数来存储,问题就又来了。比如有时需要操作或保护种子(seed),一个内部数用来存储状态和计算下一个随机数。在这些特殊情况下,共用随机生成对象是不合适的。 并发 在Java EE多线程应用程序的环境中,随机生成实例对象仍然可以被存储在类或其他实现类,作为一个静态属性。幸运的是,java.util.Random是线程安全的,所以不存在多个线程调用会破坏种子(seed)的风险。 另一个值得考虑的是多线程java.lang.ThreadLocal的实例。偷懒的做法是通过Java本身API实现单一实例,当然你也可以确保每一个线程都有自己的一个实例对象。 虽然Java没有提供一个很好的方法来管理java.util.Random的单一实例。但是,期待已久的Java 7提供了一种新的方式来产生随机数: 1.java.util.concurrent.ThreadLocalRandom.current().nextInt(10) 这个新的API综合了其他两种方法的优点:单一实例/静态访问,就像Math.random()一样灵活。ThreadLocalRandom也比其他任何处理高并发的方法要更快。 经验 Chris Marasti-Georg 指出: 1.Math.round(Math.random() * 10) 使分布不平衡,例如:0.0 - 0.499999将四舍五入为0,而0.5至1.499999将四舍五入为1。那么如何使用旧式语法来实现正确的均衡分布,如下: 1.Math.floor(Math.random() * 11) 幸运的是,如果我们使用java.util.Random或java.util.concurrent.ThreadLocalRandom就不用担心上述问题了。 Java实战项目里面介绍了一些不正确使用java.util.Random API的危害。这个教训告诉我们不要使用: 1.Math.abs(rnd.nextInt())%n 而使用: 1.rnd.nextInt(n)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值