
推荐算法
京城一十三
你在凝视深渊的时候 深渊也在凝视着你
展开
-
推荐算法-聚类-层次聚类法
层次聚类算法实际上分为两类:自上而下或自下而上。自下而上的算法在一开始就将每个数据点视为一个单一的聚类,然后依次合并(或聚集)类、直到所有类合并成一个包含所有数据点的单一聚类。因此,自下而上的层次聚类称为合成HAC。聚类的层次结构用一颗树(或树状图)表示。树的根是收集所有样本的唯一聚类,而叶子是只有一个样本的聚类。1.首先将每个数据点作为一个单独的聚类进行处理。如果我们的数据集有X个数据...原创 2019-07-16 23:44:08 · 2258 阅读 · 0 评论 -
推荐算法-聚类-DBSCAN
DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)是一个比较有代表性的基于密度的聚类算法,类似于均值转移聚类算法,但它有几个显著的优点。DBSCAN以一个从未访问过的任意起始数据点开始。这个点的领域是用距离ε(所有在ε的点都是邻点)来提取的。 如果在这个邻域中有足够数量的点(根据minPoints),那么...原创 2019-07-16 23:27:00 · 488 阅读 · 0 评论 -
推荐算法-聚类-均值偏移聚类(爬山算法)
均值偏移(Meanshift)聚类算法是一种基于滑动窗口(sliding-window)的算法,它视图找到密集的数据点。而且,它还是一种基于中心的算法,他的目标是定位每一组群/类的中心点,通过更新中心点的候选点来实现滑动窗口中点的平均值。这些候选窗口在后期处理阶段被过滤,以消除几乎重复的部分,形成最后一组中心点及其对应的组。为了解释这一变化,我们将考虑二维空间中的一组...原创 2019-07-16 15:28:18 · 2312 阅读 · 0 评论 -
推荐算法-聚类-K-MEANS
对于大型的推荐系统,直接上协同过滤或者矩阵分解的话可能存在计算复杂度过高的问题,这个时候可以考虑用聚类做处理,其实聚类本身在机器学习中也常用,属于是非监督学习的应用,我们有的只是一组组数据,最终我们要把它们分组,但是前期没有任何的先验知识告诉我们那个点是属于那个组的。当我们有足够的数据的时候可以考虑先用聚类做第一步处理,来缩减协同过滤的选择范围,从而降低复杂度。对了...原创 2019-07-16 14:54:11 · 4136 阅读 · 0 评论 -
推荐算法-矩阵分解
相关地址https://www.cnblogs.com/mafeng/p/7912229.htmlhttps://zhuanlan.zhihu.com/p/35262187矩阵分解是一个非常优雅的推荐算法,因为当设计到矩阵分解时,我们通常不会太多地区思考哪些项目将停留在所得到矩阵的列和行中。但是其使用这个推荐引擎,我们清楚地看到,u是第i个用户的兴趣向量,v是第j个电影的参数向量。...原创 2019-07-15 19:17:37 · 935 阅读 · 0 评论 -
推荐算法-协同过滤
1.什么是推荐算法? 分析大量数据,最后计算出各种关联性从而进行预测,比如Amazon的商品推荐,今日头条的信息流媒体推荐,甚至是你看个视频右侧的相似推荐等等。这些都需要涉及到推荐算法,随着近几年数据的存储、计算、获取成本不断降低,企业或者是平台所拥有的的数据量也在飞速增加,这么大的数据量需要更好的使用才能发挥出他的价值,这种价值也会成为产品能力甚至是竞争壁垒。而大数据的使用过程中,一个...原创 2019-06-27 14:14:00 · 829 阅读 · 0 评论