2020-09-04

本文详细介绍使用Python进行数据处理与分析的过程,包括从CSV和Excel文件读取数据,筛选和排序数据集,计算统计数据,处理缺失值,以及计算增长率和相关性分析。通过实例演示了如何应用pandas库进行高效的数据操作。

第十二讲练习

练习1

在这里插入图片描述

data = pd.read_csv("C:\\Users\\chen\\Desktop\\python-m notebook\\作业数据\\catNames2.csv")
#找出大于800的名字
data2 = data[data['Count_AnimalName']>800]
data2
#找出使用最多的名字
#法1,直接寻找
# data3 = data[data['Count_AnimalName']==data.max()[0]]

###法2,通过排序寻找,默认是升序,把ascending设置成false就是降序
data_3 = data.sort_values(by='Count_AnimalName')
data3 = data_3[(-1):]#也可以写成 data3 = data_3.iloc[-1,:]
data3

在这里插入图片描述
在这里插入图片描述

练习2

在这里插入图片描述

data_ex = pd.read_excel("C:\\Users\\chen\\Desktop\\python-m notebook\\作业数据\\五粮液2020.xlsx",index_col=0)
#查看数据基本信息
data_ex.describe()

在这里插入图片描述

#计算每一天各指标的差异值
data_ex.diff()

在这里插入图片描述

#计算其 pre_close 的增长率
data_pre = data_ex['pre_close'].pct_change()
data_pre

在这里插入图片描述

#将 pre_close 的增长率添加至 wly_data 数据中
data_ex.insert(6,'pct_change',data_pre)
data_ex

在这里插入图片描述

#将 pct_change 该列 呈现的 NaN 用0填充
data_ex[data_ex.isnull()] = 0
data_ex

在这里插入图片描述

#查看 pre_close 与 pct_change 的相关性
data_ex['pre_close'].corr(data_ex['pct_change'])

在这里插入图片描述

#将 pct_change 这列乘以100 保留两位小数 成为百分比
f = lambda x:"%.2f"%x
print((data_ex['pct_change']*100).apply(f))
f2 = lambda x:'{:.2%}'.format(x)
print((data_ex['pct_change']*100).apply(f2))

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值