pandas常用的数据类型:Series(一维,带标签的数组,对应数据库中的一条记录);DataFrame(二维,Series容器,对应数据库中的表)
demo.py(创建DataFrame):
# coding=utf-8
import numpy as np
import pandas as pd
# 创建DataFrame
# DataFrame类型是二维的,类似数据库中的表。
df1 = pd.DataFrame(np.arange(12, 24).reshape((3,4)))
print(type(df1)) # <class 'pandas.core.frame.DataFrame'>
print(df1)
'''
0 1 2 3
0 12 13 14 15
1 16 17 18 19
2 20 21 22 23
'''
# DataFrame对象既有行索引,又有列索引
# 行索引,每一行的索引,叫index,0轴,axis=0
# 列索引,每一列的索引,叫columns,1轴,axis=1
# 可以通过index和columns参数指定行索引和列索引
df2 = pd.DataFrame(np.arange(12, 24).reshape((3,4)), index=["a","b","c"], columns=["W","X","Y","Z"])
print(df2)
'''
W X Y Z
a 12 13 14 15
b 16 17 18 19
c 20 21 22 23
'''
# 通过字典创建DataFrame。 (字典无序对应列索引,列表有序对应行索引)
my_dict = {"name":["zhangsan","lisi"], "age":[18,20], "tel":[10086,10010]} # 每个列表的长度必须一致。
df3 = pd.DataFrame(my