问题由来
在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。
例如,考虑一下的三个特征:
["male", "female"]
["from Europe", "from US", "from Asia"]
["uses Firefox", "uses Chrome", "uses Safari", "uses Internet Explorer"]
如果将上述特征用数字表示,效率会高很多。例如:
["male", "from US", "uses Internet Explorer"] 表示为[0, 1, 3]
["female", "from Asia", "uses Chrome"]表示为[1, 2, 1]
---------------------
作者:-柚子皮-
来源:优快云
原文:https://blog.youkuaiyun.com/pipisorry/article/details/61193868
版权声明:本文为博主原创文章,转载请附上博文链接!
本文介绍了在机器学习中如何对分类特征进行独热编码,以提高处理效率。通过示例展示了如何将分类特征如性别、来源地和浏览器类型转化为数值表示,便于模型处理。
890

被折叠的 条评论
为什么被折叠?



