引言
Pandas作为Python中最流行的数据分析库,为我们提供了灵活强大的数据处理能力。特别是DataFrame对象,它是Pandas的核心数据结构之一,广泛应用于数据分析、科学计算和机器学习。本文将深入探讨如何创建DataFrame对象,DataFrame对象的属性和方法,以及如何读写DataFrame中的数据,帮助你在数据分析的旅程中更加高效。
创建DataFrame对象
DataFrame是一个二维表格结构,既可以通过现有的数据结构(如字典、列表等)来创建,也可以读取文件(如CSV、Excel)来构建。下面是几种常见的创建DataFrame的方法。
1. 从字典创建DataFrame
import pandas as pd
# 创建字典数据
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [24, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
# 从字典创建DataFrame
df = pd.DataFrame(data)
print(df)
2. 从列表创建DataFrame
# 创建二维列表
data_list = [
['Alice', 24, 'New York'],
['Bob', 30, 'Los Angeles'],
['Charlie', 35, 'Chicago']
]
# 从列表创建DataFrame,并指定列名
df_list = pd.DataFrame(data_list, columns=['Name', 'Age', 'City'])
print(df_list)
3. 从CSV文件读取DataFrame
# 从CSV文件读取数据
df_c