
搜索与推荐
飞飞好奇
Fly For Fun
深入分布式、中间件、系统架构技术研究;
专注互联网金融、互联网文化娱乐行业。
展开
-
常见的推荐方法
常见的推荐方法有四类:基于内容的推荐基于内容的协同过滤基于用户的协同过滤基于标签的推荐PS:计算相似度除了之前我们提到的余弦公式,还可以根据其他的业务数据。比如对于网易云音乐而言,两首歌越多的被加入两个歌单,可以认为两首歌越相似。对于亚马逊而言,两个商品越多的被同时购买,则认为两个商品相似。这里其实是需要根据产品的具体情况进行调整。1.基于内容推荐是基于商品的本原创 2016-11-16 18:20:38 · 2935 阅读 · 0 评论 -
Lamda架构研究
Lamda架构学习一、Lamda架构介绍Lambda架构整合离线计算和实时计算,融合不可变性(Immutability),读写分离和复杂性隔离等一系列架构原则,可集成Hadoop,Kafka,Storm,Spark,HBase等各类大数据组件。Lambda架构的目的是为应用程序提供一个低延迟的复合异步数据传输环境,例如新闻类应用,经常需要进行大规模信息处理,包括输入,归类,索引,存储等原创 2016-11-18 15:33:53 · 665 阅读 · 0 评论 -
新闻推荐:谷歌新闻、搜狐新闻、今日头条调研分析
本文从谷歌新闻、搜狐新闻、今日头条的推荐系统,分析新闻资讯行业,推荐系统采用的主要策略。1、谷歌新闻Rec(article) =IF(article) ×CF(article)IF(article)内容过滤GoogleNews把新闻文章分类到预先定义好的话题类别中,包括国际、体育、娱乐等。在日志分析中,根据用户的搜索和点击行为,构建贝叶斯框架,预测用原创 2016-12-12 14:48:18 · 2400 阅读 · 1 评论 -
TF-IDF算法学习
TF-IDF(Term Frequency-Inverse Document Frequency),中文叫做词频-逆文档频率。在文本挖掘(Text Mining)和信息检索(Information Retrieval)领域具有广泛的应用。它的基本思想是:在一个文档集合S中,根据单个文档D中某个关键字k的出现频率以及集合中出现该关键字的文档总数,计算该关键字关于文档D的权值。一、TF(Ter原创 2016-12-20 13:34:13 · 474 阅读 · 0 评论 -
阿里搜索技术,在AI路上走了多远?
以深度学习为代表的人工智能在图像、语音和NLP领域带来了突破性的进展,在信息检索和个性化领域近几年也有不少公开文献,比如wide& deep实现了深度模型和浅层模型的结合,dssm用于计算语义相关性,deepfm增加了特征组合的能力,deep CF用深度学习实现协同过滤,rnn recommender 采用行为序列预估实现个性化推荐等。工业级的信息检索或个性化系统是一个复杂转载 2017-12-29 17:31:32 · 844 阅读 · 0 评论 -
今日头条推荐算法原理全文详解
如今,算法分发已经逐步成为信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时也开始面临各种不同的质疑、挑战与误解。2018年1月,今日头条资深算法架构师曹欢欢博士,首次公开今日头条的算法原理,以期推动整个行业问诊算法、建言算法。通过让算法透明,来消除各界对算法的误解。据悉,今日头条的信息推荐算法自2012年9月第一版开发运行至今,已经经过四次大转载 2018-01-31 14:54:34 · 1380 阅读 · 0 评论 -
阿里搜索推荐系统
一、系统框架导购升级的优化思路从三个方向着手:1.策略升级。利用深度学习及异构网络的思想,对用户个性化进行更深的理解和建模;同时对因马太效应引起的独立query数下降等问题进行优化。 2.导购外投。在包括会场激活页、猜你喜欢等渠道进行搜索导购赋能,为用户打通搜索通路。 3.产品创新。一方面对现有的产品进行创新升级,如激活页、下拉推荐等;另一方面积极尝试新产品形态,如首页热词、搜索动态卡片...转载 2019-05-13 16:04:49 · 2890 阅读 · 0 评论