
数据清洗
blue_lll
这个作者很懒,什么都没留下…
展开
-
数据清洗--python
数据清洗–python 1.1引言 对于处理大数据问题,首先就是要进行数据预处理,排除掉那些那些很离谱的数据,当然我们肯定不能一个一个用眼睛来找(容易累死),所以我们就要学会如何用程序来进行数据的预处理,我们常常用两种语言:matlab和python,这里我先介绍一下用python进行数据清洗。 1.2准备 首先去官网安装python ,然后打开你的控制台,在里面输入 pip install nu...转载 2019-06-20 16:54:33 · 390 阅读 · 0 评论 -
数据清洗(二)
缺失值的处理 准备:pandas、numpy、sklearn.preprocessing中的Imputer类 import pandas as pd import numpy as np from sklearn.preprocessing import Imputer data = pd.DataFrame(np.random.randn(6, 4), columns=[‘col1’, ‘col...转载 2019-06-20 17:23:53 · 532 阅读 · 0 评论 -
数据清洗(三)过滤、筛选、删除某行
python数据清洗 数据清洗 过滤 筛选 删除 某行 #方法 str df = pd.DataFrame([ ['green', 'M', 10.1, 'label1'], ['red', 'L', 13.5, 'label2'], ['蓝色', 'XL', 15.3, 'label2']]) df.col...原创 2019-06-20 17:31:13 · 3433 阅读 · 0 评论 -
数据清洗(三)
python 数据清洗 -- coding: utf-8 -- “”” Created on Sat Aug 25 22:12:19 2018 “` @author: pindAplple “”“ -- coding: utf-8 -- import pandas as pd import numpy as np from datetime import datetime from sk...转载 2019-06-21 10:06:00 · 420 阅读 · 0 评论 -
数据清洗(四)
python数据清洗 1、筛选 ◆a = 表[表['属性列名']=='值'] print(a) ◆a = 表[表['属性列名'].isin(['值1','值2'])] print(a) 2、新建变量 ◆表['a'] = 1 #新建了一属性列 a ,并且初始化值全为1. #注意,这时候的值是 object 类型,若...原创 2019-06-21 10:07:51 · 210 阅读 · 0 评论