我们要分析的数据通常分布在几个表中,那么当我们要分析其中的数据时,需要把数据组合起来看。我们这时要对数据进行结构化处理,也被称为数据整洁。
数据整洁需要满足的三个条件:
1、每个观测值成一行。
2、每个变量成一列。
3、每个观测单元成一表。
一个学生的每课成绩排成一行,所有学生的单课成绩放在一列上,所有成绩放在一张表上。
分析信息需要组合多个表:公司信息与公司股票放在两张表,分析时需要组合起来看。
连接数据
追加行、列或者计算结果。使用 concat。
连接行

row_concat = pd.concat([df1, df2, df3]