使用pandas清洗错误数据并保存成CSV文件

本文介绍了一种使用Python的pandas库来读取飞行记录数据,并通过设置特定的阈值来识别并移除异常数据的方法。具体来说,如果飞机的高度小于20米而落地时间超过200秒,则认为该数据异常。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
import numpy as np

A319 = np.array(pd.read_csv('A319_lr.txt'))
A319_pd = pd.read_csv('A319_lr.txt')

unormal = [] # 用于存储不正常数据的行号

for i in range(len(A319)):
    if A319[i][-1] > 200 and A319[i][2] < 20: #不正常数据判断条件,我的是判断如果飞机高度小于20,但是落地时间大于200秒,数据显然错误
     #   print(i)
        unormal.append(i)
print(unormal)

A319_pd.drop(A319_pd.index[unormal],inplace=True) # 删除不正常数据所在行
A319_pd.to_csv('A319_lr_normal.txt',index=False,sep=',') # 保存成CSV文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值