关于竞赛
TASKS参赛对象:
本次大赛主要面向国内高等院校的高年级本科生和硕士,博士研究生,以及相关的从业人员,旨在通过竞赛激发更高的技术和应用创新能力,着力使百度为用户提供更好的搜索体验增添力量。
参赛选手在给定的数据集上针对赛题研究相应实现方法,编写程序运行实现,大奖赛评委会根据参赛选手程序运行所获得结果,按照预先制定的评比标准对参赛选手的作品进行评比。
任务描述:
本次创新大赛的任务是基于喜好和好友的电影推荐引擎,根据提供的包括关于用户的观看和评分记录数据,以及用户的社交关系数据,利用这些数据实现一个完整的个性化推荐算法,帮助用户发现可能喜欢的电影。
本次大赛数据集包含了14,000部电影对应的标签信息, 用户观看评分记录(User_id, Movie_id, Ratings)以及14,0000用户的社交关系,引入的社交元素,主要是微博好友关系,以及名人推荐;这些数据在保护用户隐私前提下,大部分都是明文,方便参赛者理解,更好的提升算法效果。Rating打分的范围是0-5分。分数越高,视为用户越喜欢这个电影。选手利用给定的数据来预测用户对电影的打分情况,帮助用户发现可能会喜欢的电影。
评价机制:
本次大赛评判标准我们采用参赛者的推荐预测评分值与实际评分值之间的均方根误差RMSE(Root Mean Squared Error),结果取四舍五入小数点后4位,精确到0.0001。
例如,参赛者的算法预测用户对某电影的预测评分是Y,而用户对此电影的实际评分是X,那么所得的RMSE=sqrt(sum(for all items(X-Y)^2)/n)
除此之外,参赛者根据参赛的过程,给出以下问题A和B的理解和解释,我们将作为评判的参考:
A) 协同滤波和基于内容的推荐算法的效果哪个更好?
B) 如何利用社交信息做提高推荐效果?
代码算法:
本次大赛允许选手使用任何算法,语言进行编写。
注册报名:
1. 参赛者必须于4月15日之前在百度开放研究社区上统一报名注册,注册时必须提供参赛者的基本介绍及联系方式,以供审核和后期大赛组委会联系;注册完毕后,进入“电影系统算法创新大赛”活动主页,点击右上角"