
机器学习
文章平均质量分 87
hu17889
这个作者很懒,什么都没留下…
展开
-
[bj]集体智慧编程
第2章 提供推荐(1)搜集偏好: 数据准备过程,根据用户的不同行为和物品属性确定分值(2)user-based collaborative filtering基于用户的协作性过滤 基于用户的推荐:物品x推荐给用户y的推荐值=sum(用户y1与y相似度*y1对x的评分)for each y1;item-based collaborative filtering基于物品的协作性过滤 基于物品的原创 2011-06-12 13:04:00 · 818 阅读 · 0 评论 -
相似性度量
1. 欧式距离Euclidean distance&&闵式距离Minkowsk distance&&绝对距离优点:平移旋转不变,缺点:各分量之间的相关以及量纲相关2. 马氏距离(Mahalanobis distance) (1)优点:排除变量相关性干扰:在特征提取方面若不同特征之间相关性较大的话,用欧式距离会使得相关部分的特征值被放大。若在特征描述上需要保持每个独立原创 2011-06-11 14:09:00 · 3999 阅读 · 0 评论 -
谱聚类
谱聚类是利用相似矩阵的分类方法。涉及到的理论方法有:图论概念,Laplacian矩阵,谱定理,瑞利商以及kmeans聚类。 优点:通过特征分解,可以获得聚类判据在放松了的连续域中的全局最优解。与其他算法相比,它不仅思想简单、易于实现、不易陷入局部最优解,而且具有识别非凸分布的聚类能力,非常适合于许多实际问题。 A.相关概念 1. 从拓扑空间开始,一步原创 2011-06-15 19:11:00 · 1920 阅读 · 1 评论