这一讲主要是简单的概念介绍,需要掌握的一些基本概念。包括如下几个部分:
Information Retrieval and Filtering
一些常见词汇及解释
推荐系统的分类
推荐效果的Evaluation指标
Information Retrieval and Filtering
Retrieval——invest time in indexing content 来满足用户实时的queries(need),相当于是一个内容的概括和总结,特点——静态内容,动态query。主要利用TFIDF方法
Filtering——invest effort in modeling user need 来filter出满足need的新内容。特点——静态的需求,动态的内容。
前者主要是对信息建模(对信息的概括和总结),后者主要是对用户需求建模
一些常见词汇及解释
Recommenders —— Filtering interface、Recommendation interface、Prediction Interfaces
rating —— expression of preference(Explicit/ Implicit)
prediction —— estimate of preference(一种程度的表述)
Recommendation —— selected items for user
Content —— attribute, text, etc
Collaberative —— using information from other users(协同就是使用别人的信息来干自己的事情)
推荐系统的分类
Non-personalized —— statistics(这类最常见,尤其是新闻里面,什么哪哪哪的人最爱在哪哪哪个时间段做什么什么)
Content-based —— Information Filtering / Knowledge Based
Collaberative filtering —— UU / II / Dimensionality Reduction
Other —— Critique / Interview Based Recommendation / Hybrid Techiques
这其中有三个比较重要的概念:User、Item、Rating
推荐效果的Evaluation指标
包括
accuracy(RMSE)、correctness、diversity等等