pandas数据处理 男:0 女:1

本文介绍如何使用Python的Pandas库进行数据预处理,包括创建DataFrame、映射类别特征为数值型特征等操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
df = pd.DataFrame([
            ['green', 'M', 10.1, '女','class1'], 
            ['red', 'L', 13.5, '男','class2'], 
            ['blue', 'XL', 15.3, '女','class1']])

df.columns = ['color', 'size', 'prize', 'sex','class label']
print(df)
size_mapping = {
           'XL': 3,
           'L': 2,
           'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

sex_mapping={label:idx for idx,label in enumerate(set(df['sex']))}
df['sex']=df['sex'].map(sex_mapping)
print(df)
说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL’:3,’L’:2,’M’:1 }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值