Python数据分析学习笔记(一)

本文介绍了 Pandas 库中的两种主要数据结构 Series 和 DataFrame 的基本用法,包括创建、索引、选择数据等操作,以及如何使用索引对象进行数据管理。

Pandas 入门

约定俗成-第三方库导入

from pandas import Series, DataFrame
import  pandas as pd

数据结构

Series  

由一组数据(Numpy数据类型)与以及与之相关的索引组成。
obj = Series([4,7,-5,3])
可以通过索引方式选取Series中的单个或一组值。
dict可转化为Series。

Series对象本身及其索引都有一个name属性, obj.name = '   '  ; obj.index.name = '   '
索引可以通过赋值的方式更改
frame.index = ['one','two','three','four','five']
frame.ix['three']


Dataframe

表格型数据结构,既有行索引也有列索引。
data = {'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
        'year':[2000,2001,2002,2001,2002],
        'pop':[1.5,1.7,3.6,2.4,2.9]}
可以通过指定来排序(columns=)

截取索引段信息,需要设定index值 ,才能赋予name,ix截取索引
frame.index = ['one','two','three','four','five']
frame.ix['three']

dataframe可以通过Series赋值, 根据索引一一配对,为不存在的列赋值会创造新列
frame['eastern'] = frame.state == 'Ohio'
嵌套字典也可解释为dataframe
pop = {'Nevada':{2001:2.4,2002:2.9},
       'Ohio':{2000:1.5,2001:1.7,2002:3.6}}
frame3 = DataFrame(pop)
dataframe。values 以ndarray形式返回

索引对象

obj = Series(range(3), index=['a','b','c'])
index = obj.index
索引不可变(immutable)
index方法:
 append 连接另一个index对象 产生新的index
 diff   计算差集 并得到一个index
intersection  计算交集
union   计算并集
isin 计算一个指示各值是否都包含在参数集合中的布尔型数组
delete 删除索引i处的元素,并得到新的index
drop  删除传入的值,并得到新的index
insert 将元素插入索引i处,并得到新的index
is_monitonic  将各元素均大于前一个元素时,返回True
is_unique  当index没有重负值时,返回True
unique 计算index中唯一值的数组








评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值