首先,针对该项目,关键的技术是用户的兴趣的精准挖掘。
整体的架构如下:
1. 数据生成层: 利用离线挖掘的方法对用户兴趣进行挖掘,挖掘后将用户数据存储到对应的数据库中,我们称之为用户数据库,同时我们将待推荐的微博数据也存储到数据库中,该数据库称之为推荐微博数据库。在用户数据挖掘中常用的方法有协同过滤算法、标签传播法以及word2vec等。
针对数据生成层中的用户定向主要有:(1)人群属性定向(包括年龄、性别等)(2)行为定向(一方面是用户之间的关注关系体现了用户的社交属性,另一方面是用户的行为数据主要是用户的原创、转发、评论、收藏、点赞、点击链接等体现用户的兴趣属性)(3)地理位置的定向利用移动设备记录用户的地理位置,为用户推荐相关的微博 (4)相似用户的定向:利用已经找出的一些人,找到与其相似的用户进行定向。