又到了学习干货的季节~
今天我们就来学习一下python干货~

pandas的下载
使用命令下载:
pip install pandas

或者自行下载whl文件安装
https://www.lfd.uci.edu/~gohlke/pythonlibs/

创建DataFrame数据
pd_data = pd.DataFrame({
"name":["小明","小红","小孙","王小","关宇","刘蓓","张菲"],
"age":[20,18,27,20,28,18,25],
"sex":["男","女","男","男","男","女","女"],
"score":[669,570,642,590,601,619,701],
"address":["北京","深圳","广州","武汉","深圳","广州","长沙"]
})
print(pd_data)

读取本地文件
pd_data = pd.read_excel('./测试.xlsx')
pd.set_option('display.max_columns', None) # 显示完整的列
pd.set_option('display.max_rows', None) # 显示完整的行
pd.set_option('display.expand_frame_repr', False) # 设置不折叠数据
print(pd_data)

查看数据是否有缺失
# 如果缺失显示为True,否则显示False
isnull = pd_data.isnull()
print(isnull)

统计缺失值个数
null_count = pd_data.isnull().sum()
print(null_count)

缺失值填充
# 填充数据 我选择了8.888,你随意
pd_data.fillna(8.888, inplace=True)
print(pd_data)

缺失值删除
# 如果有缺失值,删除此行
exist_col = pd_data.dropna()
print(exist_col)

查看头尾文件
# 查看头尾文件
print('头文件:', pd_data.head()

本文介绍了30个Python pandas库的数据处理技巧,包括数据下载、DataFrame创建、读写文件、缺失值处理、条件筛选、字符串操作、数据统计、列操作、时间提取等,旨在加速数据分析过程。
最低0.47元/天 解锁文章
5万+

被折叠的 条评论
为什么被折叠?



