数据分析之pandas_20题
系列文章
数据分析之pandas_20题_1-5
数据分析之pandas_20题_11-15
数据分析之pandas_20题_16-20
写在前面的话
这边笔记主要记录一些在数据分析过程中使用到的pandas模块的方法,希望可以帮到需要的人。
pandas 20题并不是简单的20个题目哟,是20中不同的需求。
pandas是什么?
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。常用语数据分析处理
引入库
代码如下(示例):
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
6. 时间索引
在很多情况下,我们获取到的记录都是以时间作为索引的,方便记录和处理
=构建时间索引=
pd.date_range(
start=None, # 开始时间
end=None, # 结束时间
periods=None, # 索引个数
freq=None, # 间隔 D:天,H 小时,
tz=None, # 时区
normalize=False, #
name=None, #
closed=None, # None闭区间,left左闭右开,right 左开右闭
**kwargs,
)
freq 可选参数 D 天,B 工作日,H 小时, T/min 分钟, S 秒,M 月末,BM 月最有一个工作日,MS 月初,BMS 月第一个工作日
pd.date_range('20200930',periods=10,freq='2D')
结果

pd.date_range('20200930',periods=10,freq='5H')
结果

当DataFrame的索引是时间索引时,可以针对时间做其他分析
df = pd.DataFrame(index=pd

本文是关于使用Pandas进行数据分析的系列文章,涵盖了从时间索引的构建、修改索引和列名,到统计数据集中类别和数值的分析。通过实例展示了如何利用pandas进行时间序列操作、数据重塑以及聚合函数的应用。
最低0.47元/天 解锁文章
700

被折叠的 条评论
为什么被折叠?



