- 博客(7)
- 收藏
- 关注
原创 《统计学习方法》第一章学习笔记
生成模型和判别模型的区别:生成模型:通过联合概率计算生成值的概率,模型表示为P(Y∣X)=P(X,Y)P(X)P(Y|X)=\frac{P(X,Y)}{P(X)}P(Y∣X)=P(X)P(X,Y)判别模型:直接计算生成值的概率,模型表示为P(Y∣X)P(Y|X)P(Y∣X)或者是f(X)f(X)f(X)习题1.1说明伯努利模型的极大似然估计以及贝叶斯估计中的统计学习方法三要素。伯努利模...
2020-04-19 17:55:06
244
原创 python(计算数据偏差和峰度)
numpy.set_printtoptions(edgeitems=5):值过多,显示前5个和后5个偏度:衡量随机分布的不均衡性,偏度=0,数值相对均匀的分布在两侧峰度:概率密度在均值处峰值高低的特征python计算数据均值、标准差、偏度、峰度:import numpy as npfrom scipy import statsx = np.random.randn(1000...
2018-03-06 19:37:09
13225
翻译 Challenging the Long Tail Recommendation(2012)
长尾推荐的挑战摘要:本文提出一种新的基于图的算法应用于长尾推荐,该算法采用无向边权图代表用户信息。1、简介本文所提方法的优点:1、保证商品推荐的多样性,针对一些非主流的音乐或电影,也能找到目标客户;2、对不同的用户-项目打分对采取不同处理方法,提高长尾推荐的准确性;3、我们提出的算法可以为不同的基础用户提供更多样化的推荐,为促进销售的多样性奠定了坚实的基础。可构建实时推荐系统。本文的贡
2018-01-31 09:15:27
407
翻译 Niche Product Retrieval in Top-N Recommendation(2010)
利基产品推荐摘要:个性化推荐的一大挑战是长尾市场中的目标产品推荐。即推荐目标用户喜欢的,而不是流行产品。针对这一目标,本文提出两种策略,第一种策略是降低商品的流行度,并将其应用到Top-N推荐;第二种策略是基于商品流行度和用户参与度给出先验概率分布,采用统计模型计算用户和商品的相关度。1、简介Anderson认为有些商品用传统的销售渠道是无法获得大量销售额的,并认为未来的销售模式是“少
2018-01-30 14:55:12
443
翻译 Improving Aggregate Recommendation Diversity Using Ranking-Based Techniques
使用基于排序的技术改进总体推荐多样性摘要:大多数的推荐算法都改进推荐的准确性,忽视了推荐的多样性。这篇文章提出了一些商品推荐技术,在准确率的前提下,还能保证多样性(。。。。。。未完待续)
2018-01-29 17:40:06
488
翻译 (翻译)The Long Tail of Recommender Systems and How to Leverage It
长尾商品推荐系统2.3 长尾问题的解决方法:对项目集进行聚类导致长尾推荐问题的原因是,没有足够的数据进行长尾商品的模型预测,聚类可以适当解决该问题。举例来说,在movieLens数据集上,使用EM方法把1682部电影聚为10类,用以构建预测模型(比如每一类都有一个支持向量机模型,总共就有10个SVM模型)。如果想预测用户C对The Other Boleyn Girl这部电影的评分,首先
2018-01-29 17:22:14
596
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人