Python的pandas库是一个非常强大的数据处理工具,其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格,有行有列,可以存储各种类型的数据。
下面是一些常见的pandas DataFrame对象处理操作:
1. 创建DataFrame
python
复制
import pandas as pd
# 使用字典创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)
# 打印DataFrame
print(df)
2. 查看DataFrame的基本信息
python
复制
# 查看前几行数据
print(df.head())
# 查看后几行数据
print(df.tail())
# 查看数据的基本信息,包括每列的非空值数量、类型等
print(df.info())
# 查看数据的摘要统计
print(df.describe())
3. 选择数据
python
复制
# 选择单列
print(df['Name'])
# 选择多列
print(df[['Name', 'Age']])
# 使用iloc根据整数位置选择行和列
print(df.iloc[0:2, 0:1]) # 选择前两行,第一列
# 使用loc根据标签选择行和列
print(df.loc[0:2, 'Name']) # 选择前两行,'Name'列
4. 数据清洗
python
复制
# 删除含有缺失值的行
df_dropna = df.dropna()
#

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



