有运营的一些同事问我如何挑选“将来最受欢迎的帖子”推到首页,或者置顶。
最简单的方式就是看看时下人们都在关心一些什么问题,比如前段时间房价政策的调整,推一些跟楼市相关的帖子效果肯定好。
从数据挖掘的角度来说,该问题等价
“如何预测一个帖子的热度,即它的受欢迎程度“。
之前上线的帖子关联项目,是基于用户访问行为,通过
apriori算法,计算出两个帖子的提升度值,提升度值高,说明两个帖子的关联越强。通俗的讲就是浏览A帖子的人大部分也浏览了B帖子,在这个过程中我们也预测了看了A帖子的人可能会对B帖子感兴趣。
所以我认为数据挖掘的价值在于,基于历史数据,通过模型预测未来的趋势。
回到上面问题:如何预测一个帖子的热度?
主要分两步: