Python 数据处理与函数编程技巧
1. 数据求和与统计计算
在处理大规模数据并生成总和或其他统计信息时,Pandas 库是一个强大的工具。以芝加哥的老鼠和啮齿动物城市数据库为例,该 CSV 文件包含约 74000 条记录。
1.1 数据读取与探索
import pandas
# 读取 CSV 文件,跳过最后一行
rats = pandas.read_csv('rats.csv', skip_footer=1)
print(rats)
# 探索特定字段的值范围
print(rats['Current Activity'].unique())
1.2 数据筛选与统计
# 筛选数据
crew_dispatched = rats[rats['Current Activity'] == 'Dispatch Crew']
print(len(crew_dispatched))
# 找出芝加哥 10 个老鼠感染最严重的 ZIP 代码区域
print(crew_dispatched['ZIP Code'].value_counts()[:10])
# 按完成日期分组
dates = crew_dispatched.groupby('Completion Date')
print(len(dates))
# 确定每日数量
date_counts = dates.size()
print(date_counts[0:10])
# 对数量进行排序
date_counts.sort()
print(d
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



