
机器学习
文章平均质量分 95
CoderBoom
on the way
展开
-
推荐系统-机器学习理论基础详解01
推荐系统-机器学习理论基础详解1.大数据时代究竟改变了什么?(了解)改变的是思维方式1.数据重要性:数据资源--------数据资产(增值)2.方法论:基于知识的理论完美主义-------基于数据的历史经验主义翻译:你好吗?基于知识翻译:----借助语言学家你 you your好 good best等吗 do does等Are you good?Are y...原创 2019-01-15 18:09:52 · 592 阅读 · 0 评论 -
推荐系统-Ctr点击率预估理论基础及项目实战
Ctr点击率预估理论基础及项目实战1.机器学习推荐算法模型回顾召回(粗排)利用业务规则结合机器学习推荐算法得到初始推荐结果,得到部分商品召回集ALS\UserCF\ItemCF\FP-Growth\规则等方式召回排序(精排)1期:根据不同推荐位通过不同的模型得到推荐结果2期:将推荐的所有结果通过Ctr或Cvr预估结果进行排序GBDT\LR\GBDT+LR\FM()\FFM...原创 2019-03-25 09:21:54 · 9006 阅读 · 16 评论 -
解决数据不平衡
解决数据不平衡问题方案机器学习中不平衡数据集的工具箱软件包:imbalanced-learn0.3.2介绍文档:https://pypi.python.org/pypi/imbalanced-learn/API文档:http://contrib.scikit-learn.org/imbalanced-learn/stable/详细API:http://contrib.scikit-lea...原创 2019-03-13 09:28:04 · 2608 阅读 · 0 评论 -
GBDT&XGBoost&LightGBM的区别
GBDT&XGBoost&LightGBM的区别GBDT 梯度提升树是在提升树的基础上发展而来的一种适用范围更广的方法 , 当处理回归问题时 , 提升树可以看作是梯度提升树的特例(分类问题时不时特例) . 因为提升树在构建树的每一步的过程中都是去拟合上一步获得模型在训练集上的残差 . 这个残差正好是损失函数的梯度 , 对应于GBDT每一步要拟合的对象 .主要思想 在...原创 2019-03-13 09:02:33 · 458 阅读 · 0 评论 -
推荐系统-用户标签预测算法基础实践-决策树2
推荐系统-用户标签预测算法基础实践1.泰坦尼克号获救人员识别实战加强iris的代码实战(掌握)代码版本一 : 未经过pca降温的X#1.进行数据的读入---导入数据from sklearn.datasets import load_irisiris=load_iris()#2.对数据进行简单的统计分析和图形化的展示print(iris.keys())#['data', 'tar...原创 2019-03-04 14:36:13 · 1376 阅读 · 0 评论 -
推荐系统-Python语言及数据科学库基础(三)
机器学习语言必备-数据科学必备库1.Pandas介绍Pandas的名称来自于panel data(面板数据)和Python数据分析(data analysis),Pandas是处理结构化数据的利器,利用python数据以及数据结构完成对结构化数据的处理和分析功能。特点1.一个强大的分析和操作大型**结构化数据集**所需的工具集2.基础是NumPy,提供了高性能矩阵的运算3.提供了大...原创 2019-02-15 20:51:29 · 631 阅读 · 0 评论 -
推荐系统-用户标签预测算法基础实践-决策树(一)
推荐系统-用户标签预测算法基础实践1.用户画像概述用户画像就是给到用户打标签用户画像用户角色用户属性用户画像和用户角色较为接近,而用户属性使用户的画像中的子集用户画像阶段1.用户画像基础2.用户画像指标体系3.标签数据存储方式4.标签数据开发5.性能优化及作业调度6.用户画像应用及优化用户画像基础场景用搜索领域个性化推荐领域其他领域个人征信数...原创 2019-02-21 15:55:34 · 7341 阅读 · 1 评论 -
推荐系统-Python语言及数据科学库基础(二)
机器学习语言必备-Python语言入门(二)1.函数详解函数分为4中类型根据参数和返回值进行判断没有返回值没有参数有参数没有返回值没有返回值有参数有参数有返回值的全局变量和局部变量global#函数有几种类型:#1.函数的返回值#2.函数的参数#无返回值无参数def repeatString(): print("helloWorld\...原创 2019-02-15 10:17:49 · 497 阅读 · 0 评论 -
推荐系统-Python语言及数据科学库基础(一)
机器学习语言必备-Python语言入门(一)Python基础+数据科学基础[Numpy/Pandas/Matplotlib/Scipy]1.Python语言介绍& 为什么Python如此受欢迎?Python语言特点Python:面向对象+解释型Python解析器:4种CpythonJpythonIronPythonPyPyPython版本Python2.x...原创 2019-02-15 10:17:07 · 384 阅读 · 0 评论 -
推荐系统-关联规则理论基础与业务实践
推荐系统-关联挖掘算法实战1.基于知识的推荐方法简介基于知识区别于以往基于协同过滤算法,基于知识的推荐更多的是交互式问答的环节,分为基于约束的部分,第二是基于实例的部分,使用基于关联规则方法全是基于知识的推荐。2.关联规则算法引入啤酒与尿布的故事关联规则-------寻找关联购买商品的关系**关联分析,**用于发现隐藏在大型数据集中有意义的联系。购物篮分析----一次购买分析-...原创 2019-01-27 10:23:20 · 1125 阅读 · 0 评论 -
推荐系统-基于模型协同过滤理论基础与业务实
推荐系统-基于模型协同过滤理论基础与业务实践1.SparkMllib库框架详解Spark机器学习库五个组件ML Algratham算法 : 分类 , 聚类 , 降维 , 协同过滤Pipelines管道 ----Featurization 特征化---- 特征抽取 , 特征转换 , 特征降维 , 特征选择Persistence 持久化---- 模型的保存 , 读取 , 管道操作...原创 2019-01-27 10:19:20 · 1612 阅读 · 0 评论 -
推荐系统-经典协同过滤算法【基于记忆的协同过滤算法、基于模型的协同过滤算法】
推荐系统-经典协同过滤理论基础实践1.协同过滤推荐方法CF简介协同过滤CF基于记忆的协同过滤 ---- 用户和物品的相似度矩阵用户相似度的推荐物品相似度推荐UserCF用户协同过滤算法ItemCF物品的协同过滤推荐算法基于模型的协同过滤 ---- 隐因子LFM(latent fator machine)隐藏因子的分解模型-----矩阵分解(将一个矩阵分解成连个矩阵的乘...原创 2019-01-15 22:31:27 · 9263 阅读 · 0 评论 -
MachineLearning小汇总----持续更新......
目标函数定义 : 1. GBDT(Gradient Boosting Decision Tree)Gradient Boosting是一种Boosting的方法 , 它的主要思想是每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数式评价模型性能(一般为拟合程度+正则项) , 认为损失函数越小 , 性能越好 。而让损失函数持续下降 , 就能使得模型不断提升性能 , 其最好的方法就是使...原创 2019-03-27 10:49:22 · 984 阅读 · 0 评论