python---pandas基础知识(学习笔记)

本文详细介绍Pandas库的基础知识,包括如何使用Pandas进行数据读取、存储、操作及时间序列处理,涵盖Series和DataFrame的基本使用方法,以及分组聚合、透视表和交叉表的创建技巧。

pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入 了大量库和一些标准的数据模型,提供了高效地操作大型结构化数据集所需的工具。

import pandas as pd
import numpy as np
pandas文件读取与储存
data = pd.read_csv('file.csv',sep = ',',encoding = 'gbk')
#sep是分隔符 encoding是编码格式(中文)
pd.read_sql('路径') #数据库读取
pd.read_table('路径')#文本文件读取
pd.read_excel('路径')#excel读取

#文本文件储存
data.to_csv('file',sep = ',')
data.to_sql()
data.to_excel('路径')

Series:用于存储一维数据

data = pd.Series(data=[1,2,3,4],index=['a','b','c','d'])  #创建Series对象

data.index   # index属性获取标签索引
data.values  #values属性获取元素
data.name='name'  # name属性用来描述对象
data.index.name='index Name' #为index对象设置name属性设置标签索引的名称
data.reindex(index =[ ]) #重新定义index

DataFrame:用于存储二维数据

data=pd.DataFrame(data,index=index,columns=columns)  #创建DataFrame
data.index.name='行索引标签'  # 设置行标签索引总名称
data.columns.name='列索引标签' # 设置列标签索引总名称

pandas基本操作

data.dtypes  #数据类型
data.size  #元素个数
data.shape  #行列数目
data.columns #列名
data['列名']  #访问某一列
data['列名'][:]  #查看某列的某几行
data['列名','列名']  #访问某几列
data[:][:5]  #访问前五行
data.head()
data.tail() #最后五行
data.loc[行索引名称或条件,列索引]  #切片访问 例:data.loc[:,'某列名']
data.iloc[]
data.ix[]
data['A'] = 1  #新增列A 元素均为1
data.drop('A',axis = 1,inplace = True)  
#删除A列,axis=0时为行,1是为列,true表示对源数据也进行修改

data[].describe() #统计均值,最大最小、方差等值
data[].mean()
data[].max()
data[].astype('str等类型') #改变数据类型
pd.cut(data[],bins) 
data[].value_count()  #分类计数
data[].count()
pd.cumsum()  #累计函数
#时间序列类型处理
data['时间列名'] = pd.to_datetime(data['时间列名'])  #转换时间序列类型
data['时间列名'] = pd.DatetimeIndex()
data['时间列名'] = pd.PeriodIndex()
time=data['时间列名'] + pd.Timedetal(days=1)  #时间加一天

year = [i.year for i in data['时间列名']]## 提取年份信息
month = [i.month for i in data['时间列名']]## 提取月份信息
day = [i.day for i in  data['时间列名']]## 提取日期信息
week = [i.week for i in  data['时间列名']]## 提取周信息
weekday = [i.weekday() for i in  data['时间列名']]##提取星期信息
分组聚合进行组内计算
#使用groupby拆分分组数据
data[].groupby()

#agg聚合数据
data[].agg()

#apply聚合数据
data.apply()

#transform聚合数据
data.transform()


#pivot_table创建透视表
pd.pivot_table(data,value...)


#crosstab创建交叉表
pd.crosstab()
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值