2020-09-04

最新推荐文章于 2025-12-23 20:09:26 发布

原创最新推荐文章于 2025-12-23 20:09:26 发布 · 264 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#数据分析 #大数据

学习作业专栏收录该内容

9 篇文章

订阅专栏

本文详细介绍使用Python进行数据处理与分析的过程，包括从CSV和Excel文件读取数据，筛选和排序数据集，计算统计数据，处理缺失值，以及计算增长率和相关性分析。通过实例演示了如何应用pandas库进行高效的数据操作。

第十二讲练习

练习1

在这里插入图片描述

data = pd.read_csv("C:\\Users\\chen\\Desktop\\python-m notebook\\作业数据\\catNames2.csv")
#找出大于800的名字
data2 = data[data['Count_AnimalName']>800]
data2

#找出使用最多的名字
#法1，直接寻找
# data3 = data[data['Count_AnimalName']==data.max()[0]]

###法2，通过排序寻找，默认是升序，把ascending设置成false就是降序
data_3 = data.sort_values(by='Count_AnimalName')
data3 = data_3[(-1):]#也可以写成 data3 = data_3.iloc[-1,:]
data3

在这里插入图片描述

练习2

在这里插入图片描述

data_ex = pd.read_excel("C:\\Users\\chen\\Desktop\\python-m notebook\\作业数据\\五粮液2020.xlsx",index_col=0)
#查看数据基本信息
data_ex.describe()

在这里插入图片描述

#计算每一天各指标的差异值
data_ex.diff()

在这里插入图片描述

#计算其 pre_close 的增长率
data_pre = data_ex['pre_close'].pct_change()
data_pre

在这里插入图片描述

#将 pre_close 的增长率添加至 wly_data 数据中
data_ex.insert(6,'pct_change',data_pre)
data_ex

在这里插入图片描述

#将 pct_change 该列 呈现的 NaN 用0填充
data_ex[data_ex.isnull()] = 0
data_ex

在这里插入图片描述

#查看 pre_close 与 pct_change 的相关性
data_ex['pre_close'].corr(data_ex['pct_change'])

在这里插入图片描述

#将 pct_change 这列乘以100 保留两位小数 成为百分比
f = lambda x:"%.2f"%x
print((data_ex['pct_change']*100).apply(f))
f2 = lambda x:'{:.2%}'.format(x)
print((data_ex['pct_change']*100).apply(f2))

在这里插入图片描述