问题描述
我有一个用于模型训练的DataFrame如下图所示:
其中的country、province、city、county四列其实是位置信息的不同层级,应该合成一列用于模型训练
方法:
parent_teacher_data['address'] = parent_teacher_data['country']+parent_teacher_data['province']+parent_teacher_data['city']+parent_teacher_data['county']
就可以把四列合并成新的列address
如果某一列是非str类型的数据,那么我们需要用到map(str)将那一列数据类型做转换:
dataframe["newColumn"] = dataframe["age"].map(str) + dataframe["phone"] + dataframe["address”]
作者:AndrewHR
来源:优快云
原文:https://blog.youkuaiyun.com/gangyin5071/article/details/79601386
我的实践:
1、这是data数据,有很多列,我现在需要把每一个column的value_counts统计出来,并放在一个dataframe中;
2、代码:
data_value_counts = pd.DataFrame()
for index,item in data.iteritems(): #遍历dataframe的每一列
pd1 = pd.DataFrame({"1":item.value_counts().index,
"2":item.value_counts().values})
data_value_counts[item.name]=pd1["1"].map(str) +":"+ pd1["2"].map(str) #将两列合并为1列 ,dataframe的column属性在series这就是name属性
data_value_counts