
数据挖掘
光与热
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
浅谈矩阵分解在推荐系统中的应用
推荐系统是当下越来越热的一个研究问题,无论在学术界还是在工业界都有很多优秀的人才参与其中。近几年举办的推荐系统比赛更是一次又一次地把推荐系统的研究推向了高潮,比如几年前的Neflix百万大奖赛,KDD CUP 2011的音乐推荐比赛,去年的百度电影推荐竞赛,还有最近的阿里巴巴大数据竞赛。这些比赛对推荐系统的发展都起到了很大的推动作用,使我们有机会接触到真实的工业界数据。我们利用这些数据可以更好地学习转载 2017-08-28 15:52:03 · 811 阅读 · 1 评论 -
spark mllib ALS算法简介
一、矩阵分解模型。用户对物品的打分行为可以表示成一个评分矩阵A(m*n),表示m个用户对n各物品的打分情况。如下图所示:其中,A(i,j)表示用户user i对物品item j的打分。但是,用户不会对所以物品打分,图中?表示用户没有打分的情况,所以这个矩阵A很多元素都是空的,我们称其为“缺失值(missing value)”。在推荐系统中,我们希望得到用户对所有物品的打分情况,如果用户没有对一个转载 2017-09-06 18:51:22 · 1364 阅读 · 0 评论 -
生成学习算法和朴素贝叶斯
内容提要这篇博客的主要讲生成学习算法,主要包括两个算法: - 高斯判别分析(Gaussian Discriminant Analysis) - 朴素贝叶斯(Naive Bayes)now let’s begin前言今天学习的生成学习算法依然属于监督式学习算法,我们需要输入训练集,训练参数,然后进行分类。比如我们输入动物的特征x(function () {的关系如下:其中p(x)。根据我们对这些特转载 2017-10-17 16:05:56 · 441 阅读 · 0 评论