
python数据分析
文章平均质量分 70
Qi_Xi_Miao
python学习笔记记录
展开
-
时间序列
日期和时间数据类型datetime是一个关于时间的库,常用的类有1、date类型,存储公历日期:年、月、日2、time类型,存储时间:时、分、秒3、datetime类型:存储日期时间日期类型的使用# 导入datetime模块import datetime# 创建日期date = datetime.date(2021, 4, 15)print(date)# 获取年print(date.year)# 获取月print(date.month)# 获取日print(date.day)原创 2021-04-15 21:36:31 · 347 阅读 · 0 评论 -
多层索引
目录多层索引的创建多层索引的取值多层索引的排序多层索引的创建# 多层索引series的创建import pandas as pds = pd.Series([1,2,3,4,5,6],index=[['张三','张三','李四','李四','王五','王五'], ['期中','期末','期中','期末','期中','期末']])# 张三一列是数据的第一层索引,期中一列是数据的第二层索引,而第二层索引值是和数据一一对应的。pri原创 2021-04-14 21:16:11 · 376 阅读 · 0 评论 -
数据的分组
目录数据的分组遍历分组按多列进行分组统计分组后的数据数据的分组Pandas提供了一个灵活高效的groupby功能,它能对数据集进行切片、切块、摘要等操作。DataFrame.groupby('列索引'), 分组后的结果为DataFrameGroupBy object,是一个分组后的对象。用groupby的size()方法可以查看分组后每组的数量,并返回一个含有各分组所包含数值数量的Series:print(groups.size())import pandas as pdimport random原创 2021-04-13 20:55:50 · 479 阅读 · 0 评论 -
数据的合并、筛选、排序
目录数据的合并concat()函数merge()函数数据的筛选根据某列的值进行筛选多条件的联合筛选数据的排序数据的合并数据合并主要包括下面两种操作:轴向连接(concatenation):pd.concat()可以沿一个轴将多个DataFrame对象连接在一起,形成一个新的DataFrame对象。融合(merging):pd.merge()方法可以根据一个或多个键将不同DataFrame中的行连接起来。concat()函数concat()函数可以将数据根据不同的轴作进行合并。我们先看一下conc原创 2021-04-09 21:35:52 · 578 阅读 · 0 评论 -
pandas数据的处理
目录删除数据删除空值删除数据空值的处理重复数据的处理删除数据删除空值如果文件的单元格中没有值时,在使用pandas读取后就会用NaN表示,也就是我们常说的空值。# 在NumPy模块中提供了nan的值,如果你想要创建一个空值,可以使用下方代码:from numpy import nan as NaN需要注意的是,NaN比较特殊点就是其本身是一种float类型数据。当NaN参与到数据计算中,最终的结果永远都是NaN。对于大批量的Series数据,使用肉眼很难判断空值的存在,这时我们可以先对空值进原创 2021-04-07 20:10:24 · 362 阅读 · 1 评论 -
pandas写入和读取数据
目录数据的写入写入csv写入excel数据的读取csv的读取excel的读取数据的写入写入csvcsv是最为常见的以纯文本文件存储数据文件的格式,它的优点是通用性很强,不受操作系统以及具体的软件的限制。import pandas as pddf_dict = { 'name':['ZhangSan','LiSi','WangWu','ZhaoLiu'], 'age':['18','20','19','22'], 'weight':['50','55','60','80']}df = pd原创 2021-04-06 20:40:30 · 365 阅读 · 0 评论 -
Series和DataFrame的属性和方法
目录Series常用属性和方法DataFrame数据的选择、遍历、修改常用属性与方法获取行列数据遍历Series常用属性和方法表格数据中的每一列或者每一行的数据结构都是Series,它可以看成是一维的表格数据。它可以属于DataFrame的一部分也可以作为一个独立的数据结构存在。其具有以下属性和方法:series.values —> 数据的值series.index —> 数据的索引series.items() —> 每对索引和值values、index、items返回的对象原创 2021-04-05 17:08:35 · 1473 阅读 · 0 评论 -
pandas简介
pandas模块简介数据结构Series的创建DataFrame的创建数据分析的流程:设定问题—》获取数据—》整理及清洗数据—》数据分析及可视化—》建立模型(预测性的分析)—》撰写报告简介Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。作用:数据读写;数据整理;数据分析。利用Pandas进行数据操作、预处理、清洗是Py原创 2021-04-05 11:20:22 · 172 阅读 · 0 评论