pandas使用

最新推荐文章于 2024-06-10 15:53:13 发布

原创最新推荐文章于 2024-06-10 15:53:13 发布 · 348 阅读

CC 4.0 BY-SA版权

文章标签：

7 篇文章

订阅专栏

pandas

pandas主要有两个数据结构：Series和DataFrame

Series

使用字典也可创建：

stada={'ab':12,'cd':09}
obj=Series(stada)

DataFrame

DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值的类型（数值、字符串、布尔）。既有行索引，也有列索引，它可以被看作有Series组成的字典（共用一个索引）

data={'state':['aa','bb','cc','dd'],'year':[2000,2001,2002,2000,2001]}
frame=DataFrame(data)  //会自动加上索引，从0开始

data是数据，columns指明data列的顺序（如果data没有指明的列，则整个列的值都为Nan），index是行名：frame=DataFrame(data,columns=[‘year’,’debt’,’state’],index=[1,2,3,4,5])
DataFrame->Series : frame[‘state’]或者是frame.year //拥有与DataFrame相同的索引
frame[‘state’]=‘CHINA’ //所有的state值都为CHINA
frame[‘debt’]=np.arange(5)

令debt部分值改变：

令debt部分值改变：
//将索引为2，4，5且列为debt的值分别改为2,5,8
val=Series([2,8,5],index=[2,4,5])
frame['debt']=val

假如数据类型是嵌套字典，如：

pop={"Nevade":{2001:2.4,2002:2.9},'Ohio':{2000:9.9,2001:2.2}}
frame4=DataFrame(pop)
//2000-2002为该DataFrame的索引，Nevade、Ohio为该DataFrame的columns

重新索引

丢弃指定轴上的项