- 博客(14)
- 资源 (1)
- 收藏
- 关注
原创 python多维列表想要分别赋值结果同时赋值
使用以上方式创建,在赋值的时候,比如我要给。其中原理没有深究,如果你有补充,欢迎留言。想要初始化一个多维空列表,如。,但是列表的数量由一个数字。
2023-09-20 13:38:02
349
1
原创 python list 按列进行分组聚合
我想要的最终结果长这样,即将上面的列表中按每一个元素(如。)进行分组,然后记录起止。操作进行分组再取出元素。原始的数据大概长这样。
2023-09-11 11:52:34
472
原创 处理复旦大学中文文分类数据集
目录1. 处理原始数据2. 分词、去停用词3. 存储到csv4. 存储到数据库5. 主函数7. 最终结果展示6. 注意内容7. 资源列表8. 完整代码复旦大学中文文本分类数据集是一个小型轻量的数据集,常用于自然语言处理文本分类,文本聚类实验中,本文通过使用Python将该数据集进行基本处理,并分别存储到csv和sql文件中。1. 处理原始数据原始数据的格式为(如图1.1),每个文件夹中有不等量的.txt文件,每个文件为一篇语料。图1.1:原始数据格式读取类别文件列表,用os模块读取原始数据
2022-05-01 12:52:22
5189
10
停用词表(包含常见的停用词表,以及汇总停用词表)
2022-05-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人