在学习用tensorflow打造唐诗生成网络时看到如下函数:
words,_=zip(*count_paris)
words = words[: len(words)]
word_int_map = dict(zip(words,range(len(words))))
代码中的count_paris为类似[你:2, 我:3 , 他:5,好:4,……]的list,里面包含词及其对应的个数;
第一句代码含义表示提取words=[你,我,他]
第二句代码含义表示取前len(words)个词构成的words,这里的长度可依据实际情况更改,思路是保留高频词汇;例如len取了3,最后words=(你,我,他)
第三句代码就是将中文词汇和对应计算机能识别的数字做映射,这里举的例子很简单,和range(保留词个数)的数字多对应;例如range(3),则表示数字范围为0,1,2;则zip((你,我,他),(0,1,2))后变为[(你,0),(我,1),(他,2)]
zip()函数
描述
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。
语法
zip 语法:
zip([iterable, ...])
参数说明:
- iterabl -- 一个或多个迭代器;
返回值
返回元组列表。
实例
以下实例展示了 zip 的使用方法:
>>>a = [1,2,3]
>>> b = [4,5,6]
>>> c = [4,5,6,7,8]
>>> zipped = zip(a,b) # 打包为元组的列表
[(1, 4), (2, 5), (3, 6)]
>>> zip(a,c) # 元素个数与最短的列表一致
[(1, 4), (2, 5), (3, 6)]
>>> zip(*zipped) # 与 zip 相反,可理解为解压,返回二维矩阵式
[(1, 2, 3), (4, 5, 6)]
>>> b = [4,5,6]
>>> c = [4,5,6,7,8]
>>> zipped = zip(a,b) # 打包为元组的列表
[(1, 4), (2, 5), (3, 6)]
>>> zip(a,c) # 元素个数与最短的列表一致
[(1, 4), (2, 5), (3, 6)]
>>> zip(*zipped) # 与 zip 相反,可理解为解压,返回二维矩阵式
[(1, 2, 3), (4, 5, 6)]