DataFrame 是Python的一种外置数据类型, Pandas 中的一个表格型的数据结构,和现实的数据二维表格相同,包含多个有序的列,每列可以是不同的值类型(数值、字符串、布尔型等)。DataFrame 即有行索引也有列索引,可以看做是由 Series 组成的字典。使用DataFrame对象来创建该数据类型时,可以使用多种数据类型来生成该数据类型。
而二维表格数据是数据分析和挖掘中很常用的数据类型,数据的处理、清洗等特征的处理,极大部分是基于这种数据类型,下面将从各个细节和内容,详细介绍这种数据类型的处理,便于后续数据分析和挖掘、模型建立打下基础。跟上思路,你也可以成为数据分析挖掘的专家,更为AI智能模型的理解打下基础。
DataFrame的创建方法
1、使用字典类型
创建DataFrame数据,字典的格式形式大家都记着吧,包含两个主要的内容键和值,而键将成为列名,而值将成为列数据。
import pandas as pd
data1 = { '日期':['2024/4/9','2024/4/10','2024/4/11','2024/4/12'],
'开盘': [146.5,146.2,142.6,142],
'收盘': [146.48,143.12,142.34,140.49],
'最高': [148.21,146.5,142.66,143.45],
}
df1 = pd.DataFrame(data1)