Pandas 统计分析基础----教材知识(1)

目录

Pandas中的结构数据

Series

DataFrame

Pandas中的结构数据

pandas的三种常用数据结构
说明
Series类似数组一种一维数组对象,包含一个值序列,并且包含数据标签,称为索引(index),通过索引来访问数组中的数据。
DataFrame类似表格一个表格型的数据结构,它含有一组有序的列,每列可以是不同类型的值(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看作由Series组成的字典(共用同一个索引)。跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。
构建DataFrame的方式有很多,最常用的是直接传入一个由等长列表或NumPy数组组成的字典来形成DataFrame。
Panel可视为Excel的多表单
Series
功能示例代码说明(运行结果)
创建obj = pd.Series([1,-2,3,-4])
指定索引obj1 = pd.Series(obj,index = i,name = "col")

index每行为索引名

name是对该数组命名

位置与标签使用

obj = pd.Series([1,-2,3,-4])

print(obj[0],obj.index)

字典创建

sdata = ('a':0,'b':1,'c':2)

obj2 = pd.Series(sdata)

字典键值与索引不匹配

letter = ['a','b','c','d']

obj3 = pd.Series(sdata,index = letter)

输出中d的键值为NaN
自动对齐不同索引数据

sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Útah': 5000]

obj1 = pd.Series(sdata)

states = ['California', 'Ohio', 'Oregon', 'Texas']

obj2 = pd.Series(sdata, index= states)

print(obj1+obj2)

California NaN

Ohio 70000.0

Oregon 32000.0

Texas 142000.0

Utah NaN

dtype: float64

索引修改obj.index = ['aa','bb','cc','dd']
DataFrame
功能示例代码说明
创建

data = {

    'name':['张三','李四','王五','小明'],

    'sex':['female','female','male','male'],

    'year':[2001,2001,2003,2002],

    'city':['北京','上海','广州','北京']

}

df = pd.DataFrame(data)

指定+自动索引df1 = pd.DataFrame(data,columns = ['name','sex','year','city'])
自动补空缺值为NaNdf1 = pd.DataFrame(data,columns = ['name','sex','year','city','address'])
指定列名

df1 = pd.DataFrame(data,columns = ['name','sex','year','city']

index = ['a,'b','c','d'])

显示索引与列

print(df1.index)

print(df1.columns)

查找

print('name' in df1.columns)

print('a' in df1.index)

ture

ture

Index 的常用方法与属性

Index 的常用方法与属性
方法属性
append连接另一个Index对象,产生一个新的Index
diff 计算差集,并得到一个Index
intersection计算差集,并得到一个Index
union计算并集
isin计算一个指示各值是否都包含在参数集合中的布尔型数组
delete 删除索引i处的元素,并得到新的Index
drop 删除传入的值,并得到新的Index
insert 将元素插入索引i处,并得到新的Index
is_monotonic 当各元素均大于或等于前一个元素时,返回True
is.unique 当Index没有重复值时,返回True
unique计算 Index中唯一值的数组

索引值的插入:df1.index.insert(1,'w')         在0和1位置间插入w

DataFrame 的常用属性

DataFrame的基础属性有values、index、columns、dtypes、ndim和shape,分别可以获取DataFrame的元素、索引、列名、类型、维度和形状。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值