Python使用pandas库，其中的DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构

原创

于 2024-04-01 18:30:38 发布 · 659 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #pandas

Python的pandas库是一个非常强大的数据处理工具，其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格，有行有列，可以存储各种类型的数据。

下面是一些常见的pandas DataFrame对象处理操作：

1. 创建DataFrame

python
复制
import pandas as pd

# 使用字典创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)

# 打印DataFrame
print(df)

2. 查看DataFrame的基本信息

python
复制
# 查看前几行数据
print(df.head())

# 查看后几行数据
print(df.tail())

# 查看数据的基本信息，包括每列的非空值数量、类型等
print(df.info())

# 查看数据的摘要统计
print(df.describe())

3. 选择数据

python
复制
# 选择单列
print(df['Name'])

# 选择多列
print(df[['Name', 'Age']])

# 使用iloc根据整数位置选择行和列
print(df.iloc[0:2, 0:1]) # 选择前两行，第一列

# 使用loc根据标签选择行和列
print(df.loc[0:2, 'Name']) # 选择前两行，'Name'列

4. 数据清洗

python
复制
# 删除含有缺失值的行
df_dropna = df.dropna()

#

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。