Python学习之——zip(),zip(*)函数

本文介绍如何使用TensorFlow构建唐诗生成网络,并详细解释了如何通过统计词频来筛选并映射高频词汇的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在学习用tensorflow打造唐诗生成网络时看到如下函数:
words,_=zip(*count_paris)
words = words[: len(words)]
word_int_map = dict(zip(words,range(len(words))))

代码中的count_paris为类似[你:2, 我:3 , 他:5,好:4,……]的list,里面包含词及其对应的个数;
第一句代码含义表示提取words=[你,我,他]
第二句代码含义表示取前len(words)个词构成的words,这里的长度可依据实际情况更改,思路是保留高频词汇;例如len取了3,最后words=(你,我,他)
第三句代码就是将中文词汇和对应计算机能识别的数字做映射,这里举的例子很简单,和range(保留词个数)的数字多对应;例如range(3),则表示数字范围为0,1,2;则zip((你,我,他),(0,1,2))后变为[(你,0),(我,1),(他,2)]

zip()函数

描述

zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。

如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。

语法

zip 语法:

zip([iterable, ...])

参数说明:

  • iterabl -- 一个或多个迭代器;

返回值

返回元组列表。

实例

以下实例展示了 zip 的使用方法:

>>>a = [1,2,3]
>>>
b = [4,5,6]
>>>
c = [4,5,6,7,8]
>>>
zipped = zip(a,b)     # 打包为元组的列表
[(1, 4), (2, 5), (3, 6)]
>>>
zip(a,c)              # 元素个数与最短的列表一致
[(1, 4), (2, 5), (3, 6)]
>>>
zip(*zipped)          # 与 zip 相反,可理解为解压,返回二维矩阵式
[(1, 2, 3), (4, 5, 6)]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值