【pandas 统计分析基础】
统计分析师数据分析的重要组成部分,它几乎贯穿了整个数据分析的流程,运用统计方法,将定量与定性结合,进行的研究活动叫作统计分析.统计分析除了包含单一数值型特征的数据集趋势,离散趋势和峰度和偏度等统计知识外,还包含了多个特征比较计算等知识,本专栏将介绍pandas库进行统计分析所需要掌获的基本知识
数据闲逛人
18级双非本科学生
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pandas 统计分析基础 笔记5 _任务4.5 创建透视表与交叉表
文章目录pandas__任务4.5 创建透视表与交叉表4.5 创建透视表与交叉表代码4-67 使用订单号作为透视表索引制作透视表代码 4-68 修改聚合函数后的透视表代码 4-69 使用订单号和菜品名称作为索引的透视表代码 4-70 指定菜品名称为列分组键的透视表代码 4-71 指定某些列制作透视表代码 4-72 对透视表中的缺失值进行填充代码 4-73 在透视表中添加汇总数据4.5.2 使用crosstab函数创建交叉表代码 4-74 使用crosstab函数制作交叉表代码 4-75 订单详情表单日菜品成原创 2020-12-14 19:30:07 · 5949 阅读 · 0 评论 -
Pandas 统计分析基础 笔记4 任务4.4 使用分组聚合进行组内计算
文章目录pandas_任务4.4 使用分组聚合进行组内计算4.4.1 使用groupby方法拆分数据代码 4-51 对菜品订单详情表依据订单编号分组代码 4-52 GroupBy 类求均值,标准差,中位数代码 4-53 agg和aggregate函数的参数及其说明代码 4-54 使用agg分别求字段的不同统计量代码 4-55 使用agg方法求不同字段的不同数目统计量代码 4-56 在agg方法中使用自定义函数代码 4-57 agg方法中使用的自定义函数含NumPy中的函数代码 4-58 使用agg方法做简单原创 2020-12-14 19:27:56 · 2794 阅读 · 0 评论 -
Pandas 统计分析基础 笔记3 任务4.3 转换与处理时间序列数据
文章目录pandas_任务4.3 转换与处理时间序列数据代码 4-41 转换字符串时间为标准时间代码 4-42 Timestamp的最小时间和最大时间代码 4-43 时间字符串转换为DatatimeIndex和PeriodIndex代码 4-44 提取datetime数据中的时间序列数据代码 4-45 提取DatetimeIndex和PeriodIndex中的数据代码 4-46 使用Timedelta 实现时间数据的加运算代码 4-47 使用Timedelta实现时间数据的减运算代码 4-48 订单信息表时原创 2020-12-14 19:22:37 · 1177 阅读 · 0 评论 -
Pandas 统计分析基础 笔记2 任务4.2 掌握DataFrame的常用操作
文章目录pandas_任务4.2 掌握DataFrame的常用操作代码4-12 订单详情表的4个基本属性4-13 size,ndim,shape属性的使用4-14 使用T属性进行转置4-15 使用字典访问内部数据的方式访问DataFrame单列数据4-16 使用访问属性的方式访问DataFrame单列数据4-17 DataFrame单列多行数据获取4-18 访问DataFrame 多列的多行数据4-19 访问DataFrame多行数据4-20 使用Dataframe的head和tail方法获取多行数据4-2原创 2020-12-14 19:16:22 · 1582 阅读 · 0 评论 -
Pandas 统计分析基础 笔记1 任务4.1 读写不同数据源的数据
文章目录pandas_任务4.1 读写不同数据源的数据代码4-1 SQLAlchemy连接MYSQL数据库的代码代码4-2 使用read_sql_table, read_sql_query,read_sql 函数读取数据库数据代码4-3 使用to_sql方法写入数据代码4-4 使用read_table 和read_csv函数读取菜品订单信息表4-5 更改参数读取菜品订单信息表代码4-6 使用to_csv函数将数据写入CSV文件中代码4-7 使用read_excel函数读取菜品订单信息表代码 4-8 使用t原创 2020-12-14 17:23:21 · 1141 阅读 · 0 评论
分享