pandas入门(2)——DataFrame数据结构
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。
备注:虽然DataFrame是以二维结构保存数据的,但仍然可以轻松地将其表示为更高维度的数据(层次化索引的表格型结构。
创建1:直接传入一个由等长列表或NumPy数组组成的字典
data={'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
'year':[2000, 2001, 2002, 2001, 2002, 2003],
'pop':[1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
frame=pd.DataFrame(data)
#只显示前5行
frame.head()
#指定序列顺序
pd.DataFrame(data,columns=['year','state','pop'])
在指定序列顺序时,如果传入的列在数据中找不到,就会在结果中产生缺失值,如
frame2 = pd.DataFrame(data, columns=['year', 'state', 'pop', 'debt'],
index=['one', 'two', 'three', 'four',
'five', 'six'])
frame2
获取列的方式
通过类似字典标记的方式或属性的方式,可以将DataFrame的列获取为一个Series,如
#

DataFrame是pandas中的表格型数据结构,包含有序列和多种数据类型。它可视为Series的字典,具备行和列索引。本文介绍了如何通过字典创建DataFrame,包括获取和修改列、行的操作,以及添加和删除列的方法。
最低0.47元/天 解锁文章
2497

被折叠的 条评论
为什么被折叠?



