一、创建实例 DataFrame
df = pd.DataFrame([['沪C 100232', '奔驰', 'Y'],
['鲁A 801353', '奥迪', 'N'],
['豫H 666132', '宝马', 'Y']])
df.columns = ['车牌号', '车型', '标签']
车牌号 车型 标签
0 沪C 100232 奔驰 Y
1 鲁A 801353 奥迪 N
2 豫H 666132 宝马 Y
1.1 自定义字典,map转换’车型’数据
mapping_1 = {'奔驰': 1,
'奥迪': 2,
'宝马': 3}
df['车型'] = df['车型'].map(mapping_1)
车牌号 车型 标签
0 沪C 100232 1 Y
1 鲁A 801353 2 N
2 豫H 666132 3 Y
1.2 提取’车牌号’列数据信息
df['车牌号'] = list(map(lambda var: var[:2],df['车牌号'].tolist()))
车牌号 车型 标签
0 沪C 1 Y
1 鲁A 2 N
2 豫H 3 Y
1.3 处理’标签’列数据
mapping_2 = {value:ind for ind,value in enumerate(set(df['标签']))}
df['标签'] = df['标签'].map(mapping_2)
车牌号 车型 标签
0 沪C 1 0
1 鲁A 2 1
2 豫H 3 0
1.4 one_hot’车牌号’列数据
pd.get_dummies(df)
车型 标签 车牌号_沪C 车牌号_豫H 车牌号_鲁A
0 1 0 1 0 0
1 2 1 0 0 1
2 3 0 0 1 0
1.5 待更新
