
特征工程
么心learning
nothing
展开
-
特征工程:一行代码搞定one-hot编码
本文介绍两种one-hot编码方法。第一种方法针对字符类型的特征变量;第二种方法针对数值型特征。1.Pandas自带的get_dummies方法特征工程中,最为繁琐却很重要的一步就是处理字符型特征,对于字符型特征的处理,常用方式就是one-hot编码。先来看原始数据:做one-hot编码df = pd.get_dummies(df) #get_dummies对“整数特...原创 2019-12-25 15:58:57 · 1160 阅读 · 0 评论 -
特征工程:One-hot编码
建模时,常常会遇到有些特征变量代表的是类型或类型。比如城市(city),它的取值有San Francisco,New York和Seattle三种。代表三个城市。import pandas as pdfrom sklearn import linear_modeldf = pd.DataFrame({'City': ['SF', 'SF', 'SF', 'NYC', 'NYC', 'NY...原创 2019-05-23 15:48:31 · 1331 阅读 · 0 评论