pandas的get_dummies进行one-hot编码

本文详细介绍了Pandas库中get_dummies()函数的使用方法,包括如何将分类数据转换为虚拟变量,以及参数data、prefix、columns的用法示例。通过实例展示了在不同场景下如何应用此函数进行数据预处理。

pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)
说下常用参数
data:的话就是我们要处理的数据
prefix:就是我们制定的前缀,
columns:这是我们直接在原数据集上使用

eg:

data=pd.DataFrame({'a':['x','y','z','y','x'],'b':[1,2,3,1,2]})
data
   a  b
0  x  1
1  y  2
2  z  3
3  y  1
4  x  2

pd.get_dummies(data,prefix='love')
   b  love_x  love_y  love_z
0  1       1       0       0
1  2       0       1       0
2  3       0       0       1
3  1       0       1       0
4  2       1       0       0

pd.get_dummies(data['b'])
   1  2  3
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0
4  0  1  0

pd.get_dummies(data,prefix='love',columns=['b'])
   a  love_1  love_2  love_3
0  x       1       0       0
1  y       0       1       0
2  z       0       0       1
3  y       1       0       0
4  x       0       1       0

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值