参考资料:
https://uqer.datayes.com/v3/community/share/54ffd96ef9f06c276f651aac
https://uqer.datayes.com/v3/community/share/5514bb11f9f06c12790415b2
在Python的Pandas包中,有两种数据结构可以很方便地用于存储复杂的数据,为Series和Dataframe。
一、Series
首先先讲一下Series,Series是DataFrame的基础。Series可以认为是个具有索引(index)的一维数组,可以和编程中另一个常用的概念Hash(哈希)联系起来。
创建一个Series的基本格式为s = np.Series(data,index=index,name=name)。可以从创建最简单的Series开始:
import pandas as pd
import numpy as np
a = np.random.rand(5)
s = pd.Series(a)
print(s)
首先引入了pandas和numpy的包,可以从输出结果中看到,左边的引索默认是从0开始的,这里需要注意的是,如果需要加入制定index,指定i