
决策树
文章平均质量分 95
CoderBoom
on the way
展开
-
推荐系统-用户标签预测算法基础实践-决策树(一)
推荐系统-用户标签预测算法基础实践1.用户画像概述用户画像就是给到用户打标签用户画像用户角色用户属性用户画像和用户角色较为接近,而用户属性使用户的画像中的子集用户画像阶段1.用户画像基础2.用户画像指标体系3.标签数据存储方式4.标签数据开发5.性能优化及作业调度6.用户画像应用及优化用户画像基础场景用搜索领域个性化推荐领域其他领域个人征信数...原创 2019-02-21 15:55:34 · 7342 阅读 · 1 评论 -
推荐系统-用户标签预测算法基础实践-决策树2
推荐系统-用户标签预测算法基础实践1.泰坦尼克号获救人员识别实战加强iris的代码实战(掌握)代码版本一 : 未经过pca降温的X#1.进行数据的读入---导入数据from sklearn.datasets import load_irisiris=load_iris()#2.对数据进行简单的统计分析和图形化的展示print(iris.keys())#['data', 'tar...原创 2019-03-04 14:36:13 · 1376 阅读 · 0 评论 -
GBDT&XGBoost&LightGBM的区别
GBDT&XGBoost&LightGBM的区别GBDT 梯度提升树是在提升树的基础上发展而来的一种适用范围更广的方法 , 当处理回归问题时 , 提升树可以看作是梯度提升树的特例(分类问题时不时特例) . 因为提升树在构建树的每一步的过程中都是去拟合上一步获得模型在训练集上的残差 . 这个残差正好是损失函数的梯度 , 对应于GBDT每一步要拟合的对象 .主要思想 在...原创 2019-03-13 09:02:33 · 459 阅读 · 0 评论 -
解决数据不平衡
解决数据不平衡问题方案机器学习中不平衡数据集的工具箱软件包:imbalanced-learn0.3.2介绍文档:https://pypi.python.org/pypi/imbalanced-learn/API文档:http://contrib.scikit-learn.org/imbalanced-learn/stable/详细API:http://contrib.scikit-lea...原创 2019-03-13 09:28:04 · 2608 阅读 · 0 评论 -
推荐系统-Ctr点击率预估理论基础及项目实战
Ctr点击率预估理论基础及项目实战1.机器学习推荐算法模型回顾召回(粗排)利用业务规则结合机器学习推荐算法得到初始推荐结果,得到部分商品召回集ALS\UserCF\ItemCF\FP-Growth\规则等方式召回排序(精排)1期:根据不同推荐位通过不同的模型得到推荐结果2期:将推荐的所有结果通过Ctr或Cvr预估结果进行排序GBDT\LR\GBDT+LR\FM()\FFM...原创 2019-03-25 09:21:54 · 9034 阅读 · 16 评论 -
MachineLearning小汇总----持续更新......
目标函数定义 : 1. GBDT(Gradient Boosting Decision Tree)Gradient Boosting是一种Boosting的方法 , 它的主要思想是每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数式评价模型性能(一般为拟合程度+正则项) , 认为损失函数越小 , 性能越好 。而让损失函数持续下降 , 就能使得模型不断提升性能 , 其最好的方法就是使...原创 2019-03-27 10:49:22 · 984 阅读 · 0 评论