Python3——pandas基本的数据处理

本文介绍了如何使用pandas进行数据预处理,包括过滤包含特定字符的行、处理空值、日期格式转换、排序和去重等操作,通过实例展示了pandas在数据处理中的基本应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一般呢,我们拿到的原始数据中包含大量的脏数据,常常需要对其进行预处理,得到我们想要的数据格式。最常用的不外乎过滤数据、日期格式转换、填空值、排序、去重等,下面就用个实例来展示下pandas处理数据的基本用法吧。
原始数据:


在这里插入图片描述

实现功能:

  1. 读取原始数据
  2. 在A列中去除包含‘||’的行–>过滤数据
  3. 去除一行有3个空值的行–>过滤数据
  4. 将日期中的‘-’去掉–>日期格式转换
  5. E列的空值填1–>填空值
  6. 按D列的日期降序排列–>排序
  7. B列去重,保留第一行–>去重
  8. 保存处理结果
import pandas as pd

data = pd.read_csv('buydata.csv', sep=',', header=None, names=['cookie', 'phone', 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值