Pandas简介
pandas:强大的数据分析和处理工具
快速、灵活、富有表现力的数据结构:DataFrame数据框和Series系列
Pandas读取文本数据

#读写不同数据源的数据
import pandas as pd
data_txt = pd.read_csv('meal_order_info.txt',sep=' ') #指定一行中数据间的分隔符为空格
data_csv = pd.read_csv('meal_order_info.csv',encoding='GBK') #设置解码方式为GBK
data_txt

data_csv

储存数据框

#将数据框储存为文本文件数据
data_csv.to_csv('tmp/data_csv.csv',index=None,encoding ='gbk') #index为行索引 ,header为列索引 None为取消
Pandas读取excel文件

#Pandas读取excel文件
data_excel =pd.read_excel('meal_order_detail.xlsx',sheet_name='meal_order_detail2')
data_excel

将数据框储存为excel文件
#将数据框储存为excel文件
data_excel.to_excel('tmp/data_excel.xlsx',index=None,sheet_name='test1')
构建数据框

#series 系列
import pandas as pd
ser1 = pd.Series([1,2,'a'],index=['a','b','c'])
print(ser1)
ser2 = pd.Series({
'a':[1,2,3],'b':['1','2','3']})
print(ser2)

d=[[1.3,2.0,3,4],[2,4,1,4],[2,5,1.9,7],[3,1,0,11]]
print(d)
df = pd.DataFrame(d,index=['a','b','c','d'],columns=['A','B','C','D']) #index 设置行名称 columns 设置列名称
print(df)


d={
'color':['blue','green','yellow','red','white'],
'object':['ball','pen','pencil','paper','mug'],
'price':[1.2,1.0,0.6,0.9,1.7]}
frame = pd.DataFrame(d,index=['a','b','c','d','e'])
print(frame)
pd.DataFrame(index

这篇博客介绍了Pandas的基础知识,包括读取文本和Excel数据,数据框的存储与构建,数据访问与修改,描述性统计分析,时间类型数据处理,以及分组聚合和透视表的创建。Pandas作为强大的数据分析工具,提供了灵活的数据结构,如DataFrame和Series,方便进行数据处理和分析。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



