DataFrame的基础概念
data 有点类似Excel表格的东西, 他的每一行被称为一个Record, 每一列称为Series

创建方法
data = pd.DataFrame(data, index, columns, dtype, copy)
data 为一个二维的数组, 如ndarray, list, dict, map, series)
index 为每行的索引名称,与行数一一对应,否则报错
columns 为每一列的名称,与之对应,否则报错
dtype 指定数据类型
copy 是否拷贝数据
创建代码
data = np.arange(20).reshape(4,5)
arr = pd.DataFrame(data, index = list('1234'), columns = list('ABCDE'))

操作方法 (loc, iloc)
- loc 通过名称操作
arr.loc

arr.loc["1":"3", "A":"C"]
范围操作

- iloc 通过行下标数操作
arr.iloc[0]

arr.iloc[0:3, 3:4]
4是开区间,不包含于第四列

总结:
Ioc 是通过行和列的名称操作
iloc 是通过列数和行数的下标进行操作

DataFrame是Python数据分析库Pandas中的核心数据结构,类似于电子表格或SQL表。本文介绍了DataFrame的基础概念,包括其作为二维表格的数据组织方式,以及如何通过`pd.DataFrame()`创建DataFrame。此外,还详细讲解了使用`loc`和`iloc`进行数据操作的方法,`loc`通过列名和行标签进行选择,而`iloc`则依赖于行和列的索引号。

被折叠的 条评论
为什么被折叠?



