问题定义
冷启动即新加入的user或item, 在 user-item 二部图中, 新节点的度是0, 所以针对它们如何推荐, 就称为冷启动问题
.
包括 user,item 两部分的冷启动.
论文笔记
Addressing Cold Start for Next-song Recommendation, 这是RecSys2016 的一篇有关冷启动论文, 基于pairWise Factorization, 见[1].
motivation
Next-song Recommendation.
dataset
∣ U s e r ∣ = 28 k , ∣ S o n g ∣ = 124 k |User|=28k, |Song|=124k ∣User∣=28k,∣Song∣=124k, 10 万播放记录.
符号与公式
因为数据是成pair的,(user,last-time song, next song) ,所以为 last-time item 和 item 各自准备了一个latent space。
P
i
,
j
u
=
m
P^u_{i,j}=m
Pi,ju=m, 为用户u的transition matrix,表示在用户u的播放序列中, 有过m次在播放完歌曲i后, 下一首播放了歌曲j.
C
i
,
j
u
=
1
+
α
log
(
1
+
P
i
,
j
u
ϵ
)
C^u_{i,j}=1+\alpha \log(1+\frac{P^u_{i,j}}{\epsilon})
Ci,ju=1+αlog(1+ϵPi,ju), 从P转换得到的 confidence value.
A
i
∈
R
m
A_i\in \mathbb R^m
Ai∈Rm, audio features.
U
u
∈
R
k
U_u\in \mathbb R^k
Uu∈Rk, a user latent vector.
X
i
∈
R
k
X_i\in \mathbb R^k
Xi∈Rk, last-item latent vector.
Y
i
∈
R
k
Y_i\in \mathbb R^k
Yi∈Rk, item latent vector.
Ψ
X
∈
R
k
×
m
\Psi^X \in \mathbb R^{k\times m}
ΨX∈Rk×m,
Ψ
Y
∈
R
k
×
m
\Psi^Y \in \mathbb R^{k\times m}
ΨY∈Rk×m learn a mapping matrix between audio feature space and the item latent space, for the last-time item and item , respectively.
proposed approach
Adaptive Linear Mapping Model (ALMM).
在使用交替最小二乘法进行因式分解的同时(而不是之后), 去 learn mapped latent vectors. 这样的好处是 content feature 和 latent vectors 可以被结合的更紧密.
也就是说, 它通过同时挖掘 sequential behavior 和 content feature 来捕捉 content-based transition preference.
base approach
Oord:mapping matrix 在因式分解得到 latent vectors 之后去学习.
evaluation metrics
mean average precision(MAP),novelty,diversity,freshness, popularity.
参考
- RecSys2016,paper, Addressing Cold Start for Next-song Recommendation