本来说好要坚持每天更新自己的学习成果的,但是因为自己电脑坏了,重装了硬盘,然后自己也玩了两天,所以没有做好自己坚持的东西,在以后的34天我将每天更新自己的博客,坚持!!
今天学习的是pandas库中另一个重要的数据结构:DataFrame
1.
DataFrame表示一种长方形表格并包含已经排好序的列,DataFrame有自己的行索引与列索引,这点与Series有一点不同,Series只有自己的列索引.Dataframe的每一列可以是不同的数据类型的值,可以是字符串,数字,布尔型。构建DataFrame的方法,可以用字典dict,但是dict里面的值不再像Series里面一样每个key匹配一个单一的value,它是每个key对应一个list(列表),而key也变为了DataFrme的列索引。那么让我们来试着创建一个DataFrame.
import pandas as pd
data={'mei':['yes','no','yes','no'],'yi':[1,2,3,4],'tian':[2.1,2.8,2.9,2.7]}
frame=pd.DataFrame(data)
print(frame)
结果:
从结果我们可以知道DataFrame跟Series一样,自动给数据赋index(行索引),而列会按顺序排列好。
2.
在实际我们数据处理过程中,我们会使用DataFrame的head()方法来查看数据中到底是什么东西,以来了解。head()会返回表格的前5行数据。例:
dat