iterator/generator 应用举例 Mymap / Myzip

最新推荐文章于 2024-01-06 10:46:12 发布

原创最新推荐文章于 2024-01-06 10:46:12 发布 · 1.1k 阅读

0 ·

CC 4.0 BY-SA版权

python 专栏收录该内容

19 篇文章

订阅专栏

本文探讨了自定义`map`方法和`zip`操作的实现，通过举例说明`zip(*seqs)`和`func(*args)`的原因。解释了在元组解包和参数传递中的作用，以及`zip(*seqs)`在迭代过程中的工作原理。

现在我们编写自己的map方法，并且比较他们之间的速度

def mymap(func, *seqs):
    res =[]
    for args in zip(*seqs):                     #用的是序列组的迭代器 
        res.append(func(*args))                 #这里面一定要是*args用于解引用，把
    return res

def mymap(func, *seqs):
    return[func(*args) for args in zip(*seqs)]  #返回列表解析，它实际上就是一次性求的结果列表

上面两种方式最后都会一次性构建结果列表，所以对文件太大的话，浪费内存。
下面的方式给我们的启示：现在在mymap中for循环，你如果不管它的话，它是对zip(*seqs)是迭代处理，注意它是不停顿的，一直处理到*seqs结束；但是现在如果你想让他省内存空间和加快速度的话，你应该是在读入一段以后，把它输出去，让外面调用它的式子先把它执行了，然后我们在接着mymap中对seqs的处理。所以说你就需要在mymap中加入一个yield语句了。让读入的东西，处理完；你再接着刚才的位置读入。

def mymap(func, *seqs):
    res=[]
    for args in zip(*seqs):
        yield func(*args)

def mymap(func, *seqs):
    return(func(*args) for args in zip(*seqs))  #简单的yield操作，一般都可以转化成生成器表达式形式

问题一：为啥是zip(*seqs)和func(*args)？

刚开始我认为seqs的值是一个元组，然后我们在调用的时候，不应该是用这个形式吗？其实我当时主要是忘了考虑它实际上是在对元组进行解包。

因为譬如mymap(pow, (1,2,3),(4,5,6))最后seqs=((1,2,3),(4,5,6))即元组的元组，所以对于zip(seqs)，它将是形式zip(((1,2,3),(4,5,6)))括号里仅一个元组，你还怎么跟人家组合？我们想期待的形式应该是zip((1,2,3),(4,5,6)),这个时候就要用到解包了。你需要对seqs解包成小单元。即：*seqs=> (1,2,3),(4,5,6)

然后仍旧按照这个例子进行解析：mymap(pow, (1,2,3),(4,5,6)) 而形参是形式 mymap(func, *seqs)，所以seqs=((1,2,3),(4,5,6)),然后zip((1,2,3),(4,5,6)) ->args =(1,4) -> yield pow(*args) = yield pow(1,4)

def myzip(*seqs):
	seqs = [list(s) for s in seqs]        #for 实际上就是把大的单元划分成小块，然后再进行处理，其前一步也相当与一个解包
	res = []
	while all(seqs):
		res.append(tuple(s.pop(0) for s in seqs))
	return res

2：其实不知道你是否考虑过zip(*seqs),它究竟是在编译的时候求好结果，然后对这个结果进行一番迭代，还是for循环每执行一次，后面才给一个值呢？