pandas 处理csv文本文档,完成分词、去停用词功能

此篇博客仅以此来记录,pandas操作

由于很久没有进行数据分析方面的操作了很多的常用的东西都忘记了,因此记录一下此部分内容:

filepath = r'C:\soft\Anaconda3\emergency_frame1.csv'

import pandas as pd

data = pd.read_csv(open(filepath, encoding='utf8'), sep=',')
data.head()

显示前5条,看看是否能够正确读取csv,文件,

 此处的目的,将title和dep列的内容,整合成一篇完成的文档,并对组合后的内容进行切词,去停用词,每一篇进行换行

data_title_dep = data[["Etitle", "Edep"]].copy()#复制到新的地址,不破坏原始数据
data_title_dep["title_dep"] = data_title_dep["Etitle"]+data_title_dep["Edep"]
data_title_dep.head()

接下来即是对第三列数据进行切词,去停用词,那么我们要获取到列的内容,才可以进行。


                
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值