
Recommender System
文章平均质量分 81
quant.nxl
Coder
展开
-
推荐系统
个性化推荐个性化推荐根据用户兴趣和行为特点,向用户推荐所需的信息或商品,帮助用户在过载信息中快速发现真正所需的商品,提高用户黏性,促进信息点击和商品销售。推荐基于海量数据挖掘分析的商业智能平台,推荐主要基于以下信息:–热点信息或商品–用户信息,如性别、年龄、职业、收入、所在城市–用户历史浏览或购买行为记录–社会化关系 推荐发展历程–1995年3月,卡耐基.梅隆大学的原创 2012-11-27 00:44:29 · 1852 阅读 · 0 评论 -
“熵”--关于 读论文的一点想法
熵在维基百科上解释:点击打开链接在信息论中,熵被用来衡量一个随机变量出现的期望值。它代表了在被接收之前,信号传输过程中损失的信息量,又被称为信息熵。信息熵也称信源熵、平均自信息量。一篇论文中将熵作为检测噪声的指标:本文[1]定义了熵来描述用户模型评分的变化程度, 熵的定义如下: 用户模型Pu 可表示为统计集合Xu= { ni , i= 1, 2, ,, rm原创 2013-04-01 20:08:55 · 1264 阅读 · 0 评论 -
推荐系统~~~噪声用户(未完待续)
最初的时候,只是单纯的认为恶意评分的用户才是推荐系统中要主要检测出的,忽略了其实有些噪声用户,胡乱评分的用户也对推荐系统影响推荐准确度。 这段时间,自己没事瞎琢磨的,论文方向选择的是关于推荐系统中托攻击检测的研究,推荐系统方面也看过几篇论文,不过,对于“托”攻击检测则不是很多。“托攻击”顾名思义就是一些虚假的用户,类似生活中“托儿”。在日益激烈的电子商务网站的竞争中,推荐系统给网站带来了较大的利原创 2012-12-29 20:30:17 · 3123 阅读 · 1 评论 -
交叉验证
交叉验证是一种常用的模型选择方法。 如果给定的样本数量充足,进行模型选择的一种简单方法就是随机地将数据集切分成三部分,分别为训练集(trainning set )、验证集(validation set) 和测试集合 (test set) . 训练集用来训练模型,验证集用来模型的选择,而测试集用于最终对学习方法的评估。在学习到不同复杂度的模型中,选择对验证集有最小预测误差的模型,原创 2013-04-03 19:25:45 · 1232 阅读 · 0 评论