2.1 简介
2.2 问题定义和符号
1.基本符号定义
-
1.用户集合: U ⇒ u ∈ U \mathcal{U} \Rightarrow u \in \mathcal{U} U⇒u∈U
- U i ⇒ \mathcal{U}_i \Rightarrow Ui⇒ 表示集合中已经对物品 i i i 进行了评分的用户集合
- U i j = U i ⋂ U j ⇒ \mathcal{U}_{ij} = \mathcal{U}_{i} \bigcap \mathcal{U}_{j} \Rightarrow Uij=Ui⋂Uj⇒ 表示同时对物品 i i i 和 j j j 都进行了评分的用户集合
-
2.物品集合: I ⇒ i ∈ I \mathcal{I} \Rightarrow i \in \mathcal{I} I⇒i∈I
- I u ⇒ \mathcal{I} _u \Rightarrow Iu⇒ 表示被用户 u u u 所评分的物品集合
- I u v = I u ⋂ I v ⇒ \mathcal{I} _{uv} = \mathcal{I} _{u} \bigcap \mathcal{I} _{v} \Rightarrow Iuv=Iu⋂Iv⇒ 表示被同时被用户 u u u 和 v v v 所评分的物品集合
-
3.系统评分可选的分数集合: S \mathcal{S} S
- 例如: S = { 喜 欢 , 不 喜 欢 } \mathcal{S} = \{喜欢,不喜欢 \} S={ 喜欢,不喜欢}
-
4.系统评分集合: R \mathcal{R} R
- r u i ∈ R ⇒ r_{ui} \in \mathcal{R}\Rightarrow rui∈R⇒ 表示用户 u ∈ U u \in \mathcal{U} u∈U 对于特定物品 i ∈ I i \in \mathcal{I} i∈I 的评分
- 同时假定 r u i r_{ui} rui 的取值个数不能多于一个(要么一个取值要么没有)
2.评分预测(rating prediction)
-
为了预测某个用户对他未评价过的物品 i i i 的评分。
-
当评分存在时,这个任务通常可以定义为一个回归或者分类(多类)的问题,其目标是用学习函数:
f : U × I → S f: \mathcal{U \times \mathcal{I} \to S} f:U×I→S 来预测用户 u u u 对于新物品 i i i 的评分 f ( u , i ) f(u,i) f(u,i) -
评分集合 R \mathcal{R} R 可以分为 R t r a i n \mathcal{R}_{train} Rtrain 和 R t e s t \mathcal{R}_{test} Rtest
评估预测准确性的标准:
- 平均绝对误差(Mean Absolute Error):能更好地反映预测值误差的实际情况.
M A E ( f ) = 1 ∣ R t e s t ∣ ∑ r u i ∈ R t e s t ∣ f ( u , i ) − i u i ∣ MAE(f)= \frac{1} {|\mathcal{R}_{test}|} \sum_{r_{ui} \, \in \mathcal{R}_{test}} |f(u,i)-i_{ui}| MAE(f)=∣Rtest∣1rui∈Rtest∑∣f(u,i)−iui∣- 均方根误差(Root Mean Square Error):是用来衡量观测值同真值之间的偏差
R M S E ( f ) = 1 ∣ R t e s t ∣ ∑ r u i ∈ R t e s t ( f ( u , i ) − i u i ) 2 RMSE(f)= \sqrt{ \frac{1} {|\mathcal{R}_{test}|} \sum_{r_{ui} \, \in \mathcal{R}_{test}} (f(u,i)-i_{ui})^2} RMSE(f)=∣Rtest∣1rui∈Rtest∑(f(u,