
CatBoost
文章平均质量分 89
Sylvester_
这个作者很懒,什么都没留下…
展开
-
CatBoost 模型中标称特征的处理
标称属性 标称属性的值仅仅只是不同的名字,标称值只提供只够的信息以区分对象。只可以使用的数学运算符===和≠≠\not =,所以不能在二分决策树中直接使用。 标称属性的处理 独热编码 标称属性的一般处理方法是 one hot encoding(独热编码),可以在预处理阶段或者训练期间完成。 CatBoost 的论文提到,后者可以在训练时间方面更有效地实现,并且在CatBoost中实现了这...原创 2018-08-17 16:19:53 · 4335 阅读 · 1 评论 -
CatBoost 模型中标称型特征转换成数字型特征
接上一篇文章 CatBoost 模型中标称特征的处理 ,这篇说一下CatBoot中实现的集中处理方法。 可以查看官网原文 Transforming categorical features to numerical features。 CatBoost 支持两种类型的特征。一种是数值型,例如高度(182, 173)和任何人的二值特征(0, 1)。另外一种是标称型特征。只能取有限个可能的值,通常这些...原创 2018-10-24 20:43:30 · 2525 阅读 · 1 评论