第十二讲练习
练习1

data = pd.read_csv("C:\\Users\\chen\\Desktop\\python-m notebook\\作业数据\\catNames2.csv")
#找出大于800的名字
data2 = data[data['Count_AnimalName']>800]
data2
#找出使用最多的名字
#法1,直接寻找
# data3 = data[data['Count_AnimalName']==data.max()[0]]
###法2,通过排序寻找,默认是升序,把ascending设置成false就是降序
data_3 = data.sort_values(by='Count_AnimalName')
data3 = data_3[(-1):]#也可以写成 data3 = data_3.iloc[-1,:]
data3


练习2

data_ex = pd.read_excel("C:\\Users\\chen\\Desktop\\python-m notebook\\作业数据\\五粮液2020.xlsx",index_col=0)
#查看数据基本信息
data_ex.describe()

#计算每一天各指标的差异值
data_ex.diff()

#计算其 pre_close 的增长率
data_pre = data_ex['pre_close'].pct_change()
data_pre

#将 pre_close 的增长率添加至 wly_data 数据中
data_ex.insert(6,'pct_change',data_pre)
data_ex

#将 pct_change 该列 呈现的 NaN 用0填充
data_ex[data_ex.isnull()] = 0
data_ex

#查看 pre_close 与 pct_change 的相关性
data_ex['pre_close'].corr(data_ex['pct_change'])

#将 pct_change 这列乘以100 保留两位小数 成为百分比
f = lambda x:"%.2f"%x
print((data_ex['pct_change']*100).apply(f))
f2 = lambda x:'{:.2%}'.format(x)
print((data_ex['pct_change']*100).apply(f2))

本文详细介绍使用Python进行数据处理与分析的过程,包括从CSV和Excel文件读取数据,筛选和排序数据集,计算统计数据,处理缺失值,以及计算增长率和相关性分析。通过实例演示了如何应用pandas库进行高效的数据操作。
1万+

被折叠的 条评论
为什么被折叠?



