
数据挖掘
Sad_Sugar
这个作者很懒,什么都没留下…
展开
-
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类
转载链接:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/index.html 简介: 智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择转载 2013-07-15 00:56:29 · 1424 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤
转载链接:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/ 简介: 本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。 在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集转载 2013-07-15 00:52:49 · 1272 阅读 · 0 评论 -
java调用新浪微博API
一年前做数据挖掘用的是清华的数据集,自己看了看新浪微博的API,原创 2014-05-10 14:01:45 · 1764 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助转载 2013-07-15 00:48:55 · 1106 阅读 · 0 评论 -
K-means与KNN聚类
偶尔会遇到聚类。以后一定要写一个通用的分类器,把用过的都封装成类,以便以后调用。 经常分不清楚K-means与KNN。前者叫K均值聚类,后者叫K近邻聚类。 K-means是无监督的聚类,即给定的数据都没有标签,根据其自身特性的相似程度来聚成K类。K是指定的某个经验常数。 K-means的过程为初始化、两步迭代与停止条件。 1. 初始化时,随机选K个点作为聚类中心即可。 2. 迭代原创 2015-11-30 11:44:03 · 7908 阅读 · 0 评论 -
醍醐灌顶的文章
摘录一些看了之后非常受益的文章: PCA(主成分分析)降维:PCA的数学原理 http://blog.codinglabs.org/articles/pca-tutorial.html原创 2016-04-20 15:02:45 · 661 阅读 · 0 评论