Data Whale第20期组队学习 Pandas学习—基础知识

本文介绍Pandas库的基础知识,包括数据类型、DataFrame的创建与基本操作,以及滑动窗口、扩张窗口和指数加权窗口等高级功能。

一、Dataframe简介

1.1 Pandas常见的数据类型

数据结构 维度 说明
Series 1 一维数组,等同于list,类似于Numpy中的array
Data Frames 2 二维的表格型数据结构
Panel 3 三维数组,即Data Frames的容器

Series 一般由序列的值 data 、索引 index 、存储类型 dtype 、序列的名字 name等四个部分组成 。其中, index 可以指定名字,默认为空。

import pandas as pd
Ser=pd.Series(data=[200,'w',{
   
   'dic1':6}],
              index=pd.Index(['ID1',50,'six'],name='my_index'),
              dtype='object',
              name='Hello')
print("Ser=",Ser)
# Ser= my_index
# ID1            200
# 50               w
# six    {'dic1': 6}
# Name: Hello, dtype: object

1.2 创建Data Frames

常见创建Data Frames的方法有以下几种:
1)创建空Data Frames
2)利用dict创建
3)从其他数据源中读取(例如excel,网址等)
代码如下:

import  pandas as pd
# 1、 创建空Data Frames
df=pd.DataFrame()

print("df=",df)
# df= Empty DataFrame
# Columns: []
# Index: []

# 2、利用dict创建
dict={
   
   'name':["zhangsan","lisi","wangwu","yangliu"],
      'age':[25,31,28,19],
      'city':["guangzhou","shenzheng","hangzhou","chengdu"]}
df1=pd.DataFrame(dict)
print(df1)
#        name  age       city
# 0  zhangsan   25  guangzhou
# 1      lisi   31  shenzheng
# 2    wangwu   28   hangzhou
# 3   yangliu   19    chengdu

# 2、利用dict创建(规范化)
index=pd.Index(["zhangsan","lisi","wangwu","yangliu"],name='person')
cols=['age','city']
data = [[25,"guangzhou"],
        [31,"shenzheng"],
        [28,"hangzhou"],
        [19,"chengdu"]]
df2=pd.DataFrame(index=index
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值