
数据挖掘初步
文章平均质量分 93
水...琥珀
租赁行业算法工程师,数据挖掘,自然语言处理,如果恰巧你也是,同行!
展开
-
Python 对数据one-hot编码
目录 离散特征的编码分为2种情况:连续变量的离散化处理法1.标签的处理:法2.计算指标/哑变量one-hot编码结合pd.cut,处理连续变量合并():要注意使用merge还是join离散特征的编码分为2种情况:1.我们在进行那些有大小关系的变量离散,小雨,中雨,大雨,{“小雨”:1,“中雨”:2,“雨天”:3},这里面有一定数量的大小关系,这种映射的讲解在...原创 2018-09-16 14:16:20 · 27949 阅读 · 1 评论 -
数据第一眼
data.info()查看数据类型,数据多少,是否有NULLclass 'pandas.core.frame.DataFrame'>Int64Index: 612644 entries, 0 to 612651Data columns (total 27 columns):service_type 612644 non-null int64...原创 2018-09-13 15:47:59 · 114 阅读 · 0 评论 -
python中常用的九种预处理方法分享
python中常用的九种预处理方法分享这篇文章给大家分享了python中常用的九种预处理方法,对大家学习或使用python具有一定的参考价值,有需要的朋友们可以一起来看看。本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Varia...转载 2018-09-13 15:48:53 · 653 阅读 · 0 评论