9、数据处理与机器学习模型应用

数据处理与机器学习模型应用

1. 数据清洗

在现实世界中,大多数数据都存在一些缺陷,因此需要先进行清洗。以下是一个简单的示例,展示如何使用 Pandas 清洗数据。

1.1 读取数据

首先,我们有一个名为 small.csv 的文件,内容如下:

22,6.1
41,5.7
  18,5.3*
29,NA

可以使用 Pandas 的 read_csv 函数将其加载到数据框中:

import pandas as pd
df = pd.read_csv("small.csv")
print(df)

输出结果:

   22   6.1
0  41   5.7
1  18  5.3*
2  29   NaN

可以看到,Pandas 将第一行作为了表头,这不是我们想要的。我们可以通过设置 header=None 来解决这个问题:

df = pd.read_csv("small.csv", header=None)
print(df)

输出结果:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值