
大数据
炒饭君
这个作者很懒,什么都没留下…
展开
-
使用Python实现Hadoop MapReduce程序
hadoop支持多种语言编写mp程序,这里是网上的一篇使用python实现的mp例子转载 2015-12-26 13:23:00 · 765 阅读 · 0 评论 -
推荐系统公共资源汇总
推荐系统公共资源汇总转载 2015-12-23 16:50:18 · 1111 阅读 · 0 评论 -
A cost-effective recommender system for taxi drivers
GPS技术和新形式的城市地理学改变了手机服务的形式。比如说,丰富的出租车GPS轨迹使得出做租车领域有新方法。事实上,最近很多工作是在使用出租车GPS轨迹数据来开发手机推荐系统。这些系统可以推荐一系列的载客点,为了使得在最短的驾驶距离里最大可能地找到一个乘客。然而,在现实世界中,出租车的收入和有效的驾驶时间息息相关。换句话说,对一个出租车司机来说,在找到一个乘客前知道一个确切地驾驶路径来缩短驾驶时间更加重要。最后,在本文中,我们提出了开发一个收益比高的推荐系统。开发的目的是使得按照推荐的路径寻找乘客获得最大化原创 2015-11-30 22:24:30 · 1046 阅读 · 0 评论 -
hadoop配置文件详解、安装及相关操作
hadoop配置文件详解、安装及相关操作转载 2015-11-29 22:10:14 · 585 阅读 · 0 评论 -
聚类算法和分类算法总结
聚类算法和分类算法总结转载 2015-09-21 21:56:24 · 12054 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤
本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。 在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集 , 推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的秘密,并给出基于 Apache Mahout 的协同过滤算法的高效实现。Apache Mahout 是 ASF 的一个较新的开源项目,它源于 Lucene,构建在 Hadoop 之上转载 2015-10-08 22:03:57 · 926 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
随着 Web 技术的发展,使得内容的创建和分享变得越来越容易。每天都有大量的图片、博客、视频发布到网上。信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求,原因一是用户很难用恰当的关键词描述自己的需求,二是基于关键词的信息检索在很多情况下是不够的。而推荐引擎的出现,使用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的上下文信息更丰富的信息发现。转载 2015-11-09 19:50:10 · 810 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类
智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。 聚类 (Clustering) 是一个数据挖掘的经典问题,它的目的是将数据分为多个簇 (Cluster),在同一个簇中的对象之间有较高的相似度,而不同簇的对象差别较大。聚类被广泛的应用于数据处理和统计分析领域。Apache Mahout 是 ASF(Apache Software F转载 2015-11-09 20:09:08 · 914 阅读 · 0 评论 -
从源代码剖析Mahout推荐引擎
转自:http://blog.fens.me/mahout-recommend-engine/前言Mahout框架中cf.taste包实现了推荐算法引擎,它提供了一套完整的推荐算法工具集,同时规范了数据结构,并标准化了程序开发过程。应用推荐算法时,代码也就7-8行,简单地有点像R了。为了使用简单的目标,Mahout推荐引擎必然要做到精巧的程序设计。本文将介绍Maho转载 2015-12-12 21:03:12 · 958 阅读 · 0 评论 -
【转】机器学习最佳入门学习资料汇总
机器学习最佳入门学习资料汇总 专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门。 这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门? 资源的取舍很让人纠结,我不得不努力从一个机器学习的程序员和初学转载 2015-12-11 19:52:11 · 837 阅读 · 0 评论 -
Mahout推荐算法API详解
用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。转载 2015-12-26 14:13:13 · 795 阅读 · 1 评论