1.引入 pandas
import pandas as pd
2.从csv文档读入数据 read_csv:
In[13],直接读出文档;In[24],读文档时,分列并命名列名
3.删除重复项 drop_duplicates
4.截取字符串slice
slice(star,end)
5.分列 split 及 重新设置Column Name
从csv 文件中读取对应内容,并对某Column进行分列,之后再重新设置Column Name。
6.其他
按条件筛选:
a. dy[dy.comments.between(1000,10000)] #筛选 comments 列 >=1000,并<=10000的项目
b.dy[dy.title.str.contains('台电',na=False)] #筛选title 列包含 “台电” 的项目
c.dy[pd.isnull(dy.title)] # 筛选title 列为 null 的项目
…………
本文介绍了使用 Python 的 Pandas 库进行数据处理的基本方法,包括数据导入、删除重复项、字符串操作、分列及按条件筛选等实用技巧。
4536

被折叠的 条评论
为什么被折叠?



