Data Whale第20期组队学习 Pandas学习—基础知识
一、Dataframe简介
1.1 Pandas常见的数据类型
| 数据结构 | 维度 | 说明 |
|---|---|---|
| Series | 1 | 一维数组,等同于list,类似于Numpy中的array |
| Data Frames | 2 | 二维的表格型数据结构 |
| Panel | 3 | 三维数组,即Data Frames的容器 |
Series 一般由序列的值 data 、索引 index 、存储类型 dtype 、序列的名字 name等四个部分组成 。其中, index 可以指定名字,默认为空。
import pandas as pd
Ser=pd.Series(data=[200,'w',{
'dic1':6}],
index=pd.Index(['ID1',50,'six'],name='my_index'),
dtype='object',
name='Hello')
print("Ser=",Ser)
# Ser= my_index
# ID1 200
# 50 w
# six {'dic1': 6}
# Name: Hello, dtype: object
1.2 创建Data Frames
常见创建Data Frames的方法有以下几种:
1)创建空Data Frames
2)利用dict创建
3)从其他数据源中读取(例如excel,网址等)
代码如下:
import pandas as pd
# 1、 创建空Data Frames
df=pd.DataFrame()
print("df=",df)
# df= Empty DataFrame
# Columns: []
# Index: []
# 2、利用dict创建
dict={
'name':["zhangsan","lisi","wangwu","yangliu"],
'age':[25,31,28,19],
'city':["guangzhou","shenzheng","hangzhou","chengdu"]}
df1=pd.DataFrame(dict)
print(df1)
# name age city
# 0 zhangsan 25 guangzhou
# 1 lisi 31 shenzheng
# 2 wangwu 28 hangzhou
# 3 yangliu 19 chengdu
# 2、利用dict创建(规范化)
index=pd.Index(["zhangsan","lisi","wangwu","yangliu"],name='person')
cols=['age','city']
data = [[25,"guangzhou"],
[31,"shenzheng"],
[28,"hangzhou"],
[19,"chengdu"]]
df2=pd.DataFrame(index=index

本文介绍Pandas库的基础知识,包括数据类型、DataFrame的创建与基本操作,以及滑动窗口、扩张窗口和指数加权窗口等高级功能。
最低0.47元/天 解锁文章
1950

被折叠的 条评论
为什么被折叠?



