iterator/generator 应用举例 Mymap / Myzip

本文探讨了自定义`map`方法和`zip`操作的实现,通过举例说明`zip(*seqs)`和`func(*args)`的原因。解释了在元组解包和参数传递中的作用,以及`zip(*seqs)`在迭代过程中的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

现在我们编写自己的map方法,并且比较他们之间的速度

def mymap(func, *seqs):
    res =[]
    for args in zip(*seqs):                     #用的是序列组的迭代器 
        res.append(func(*args))                 #这里面一定要是*args用于解引用,把
    return res

def mymap(func, *seqs):
    return[func(*args) for args in zip(*seqs)]  #返回列表解析,它实际上就是一次性求的结果列表
上面两种方式最后都会一次性构建结果列表,所以对文件太大的话,浪费内存。
下面的方式给我们的启示:现在在mymap中for循环,你如果不管它的话,它是对zip(*seqs)是迭代处理,注意它是不停顿的,一直处理到*seqs结束;但是现在如果你想让他省内存空间和加快速度的话,你应该是在读入一段以后,把它输出去,让外面调用它的式子先把它执行了,然后我们在接着mymap中对seqs的处理。所以说你就需要在mymap中加入一个yield语句了。让读入的东西,处理完;你再接着刚才的位置读入。
def mymap(func, *seqs):
    res=[]
    for args in zip(*seqs):
        yield func(*args)

def mymap(func, *seqs):
    return(func(*args) for args in zip(*seqs))  #简单的yield操作,一般都可以转化成生成器表达式形式

问题一:为啥是zip(*seqs)和func(*args)?

刚开始我认为seqs的值是一个元组,然后我们在调用的时候,不应该是用这个形式吗?其实我当时主要是忘了考虑它实际上是在对元组进行解包。

因为譬如mymap(pow, (1,2,3),(4,5,6))最后seqs=((1,2,3),(4,5,6))即元组的元组,所以对于zip(seqs),它将是形式zip(((1,2,3),(4,5,6)))括号里仅一个元组,你还怎么跟人家组合?我们想期待的形式应该是zip((1,2,3),(4,5,6)),这个时候就要用到解包了。你需要对seqs解包成小单元。即:*seqs=> (1,2,3),(4,5,6)

然后仍旧按照这个例子进行解析:mymap(pow, (1,2,3),(4,5,6)) 而形参是形式 mymap(func, *seqs),所以seqs=((1,2,3),(4,5,6)),然后zip((1,2,3),(4,5,6)) ->args =(1,4) -> yield pow(*args) = yield pow(1,4)

def myzip(*seqs):
	seqs = [list(s) for s in seqs]        #for 实际上就是把大的单元划分成小块,然后再进行处理,其前一步也相当与一个解包
	res = []
	while all(seqs):
		res.append(tuple(s.pop(0) for s in seqs))
	return res

2:其实不知道你是否考虑过zip(*seqs),它究竟是在编译的时候求好结果,然后对这个结果进行一番迭代,还是for循环每执行一次,后面才给一个值呢?



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值