
搜索-推荐
文章平均质量分 86
yanerhao
信雅之言,微言大意
展开
-
文本相关性排序
文本相关性排序首先明白几个概念:Term,分词以后最小的单位,比如用Golang写一个搜索引擎,分词以后就是用,golang,写,一个,搜索引擎,那么每一个词就是一个Term。TF(Term Frequency),Term在文章中出现的频率,就是当前term在文章中出现的频率,就是term次数/总term数,比如上文中的搜索引擎这个term的TF就是1/5,TF越高那么转载 2017-08-18 18:39:56 · 3130 阅读 · 0 评论 -
推荐系统之隐语义模型
使用LFM(Latent factor model)隐语义模型进行Top-N推荐最近在拜读项亮博士的《推荐系统实践》,系统的学习一下推荐系统的相关知识。今天学习了其中的隐语义模型在Top-N推荐中的应用,在此做一个总结。隐语义模型LFM和LSI,LDA,Topic Model其实都属于隐含语义分析技术,是一类概念,他们在本质上是相通的,都是找出潜在的主题或分类。这些技术一开始都是在转载 2017-08-16 15:51:05 · 894 阅读 · 1 评论 -
协同过滤CF和基于内容推荐CB区别
推荐系统构建三大方法:基于内容的推荐content-based,协同过滤collaborative filtering,隐语义模型(LFM, latent factor model)推荐,前两者是一个完备推荐系统必有的两大算法,易于混淆,下面将做总结。原创 2017-08-14 23:43:20 · 4861 阅读 · 1 评论 -
推荐系统之基于内容推荐CB
(个性化)推荐系统构建三大方法:基于内容的推荐content-based,协同过滤collaborative filtering,隐语义模型(LFM, latent factor model)推荐。这篇博客主要讲基于内容的推荐content-based。基于内容的推荐1 Content-based System{MMDs中基于user-item profile空间的cosin相似度转载 2017-08-14 23:41:08 · 4259 阅读 · 0 评论 -
推荐系统之协同过滤
协同过滤上一节我们主要讨论了典型的推荐算法优缺点,这一节我们详细阐述一下协同过滤算法,通过讨论他们的优缺点得到一个更加深刻的认识。 Collaborative filtering (CF)算法试图找到一种通过用户行为为其提供一种具体建议的模型。他依据用户的行为数据,比如用户对读过书本的评分来判断他们对这本书的喜爱程度,关键问题在于如果有两个用户对其他物品有相似的评分那么其中一个用户对未转载 2017-08-10 11:20:11 · 699 阅读 · 0 评论 -
推荐系统
(一)推荐系统简介1. 推荐系统应用前提:(1)信息过载;(2)用户没有明确需求;2. 推荐系统的组成:前台的展示页面,后台的日志系统,推荐算法;(二)推荐系统的评测1. 实验方法(1) 离线实验优点:1)不需要有对实际系统的控制权; 2)不需要用户参与体验;转载 2017-08-14 23:30:11 · 605 阅读 · 0 评论 -
搜索之倒排索引
搜索引擎最核心的技术,倒排索引技术,倒排索引可能需要分成几篇文章才说得完,我们先会说说倒排索引的技术原理,然后会讲讲怎么用一些数据结构和算法来实现一个倒排索引,然后会说一个索引器怎么通过文档来生成一个倒排索引。倒排索引什么是倒排索引呢?索引我们都知道,就是为了能更快的找到文档的数据结构,比如给文档编个号,那么通过这个号就可以很快的找到某一篇文档,而倒排索引不是根据文档编号,而是通过文档中的转载 2017-08-19 00:40:42 · 4146 阅读 · 0 评论 -
搜索之正排索引
正排索引,也叫前向索引,和倒排索引(也叫反向索引)是相对的,正排索引相对倒排来说简单多了,第二篇文章的时候有下面两个表格(表1和表2)这个是表1文档编号文档内容1这是一个Go语言实现的搜索引擎2PHP是世界上最好的语言3Linux是C语言和汇编语言实现的4谷歌是一个世界上最好的搜索引擎公司转载 2017-08-19 00:42:44 · 1270 阅读 · 0 评论