学习心得flatten函数

本文记录在处理豆瓣电影评分数据集时,如何使用flatten函数处理list内嵌套结构以进行类型统计的问题。在数据整理过程中,因数据格式为list[[], [], ...],通过flatten函数与set去重实现类型提取,但遇到直接使用flatten报错的情况。解决办法是使用循环遍历实现去重。代码示例中展示了这一过程,虽然在pycharm中报错,但在ipython环境中正常运行。" 53147587,5522593,Zynq处理器系统ZedBoard中断机制详解,"['嵌入式开发', '硬件中断', 'FPGA', 'Zynq处理系统']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在天池下载了豆瓣电影评分的数据集,打算看看电影类型分布情况,思路是将所有的类分成一张表,然后遍历每一条记录,如果出现某一类型的文字,例如出现“爱情”类型,就在爱情字段对应的位置将0变成1,最后按字段求和得到每种类型的数量。
在这个过程中遇到几个问题,在这里记录一下

flatten函数

由于数据集保存电影类型的格式整理后是list[[],[],…],所以我要遍历list里面每一个[],来获得所有的类型,并且不重样(这里直接用set函数去重),但是直接用flatten函数会报错,所以要用循环遍历去重的方法,代码如下:

# 报错情况:
------------------------------------------------------
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值