注意力池化
-
f ( x ) = ∑ i α ( x , x i ) y i f(x)=\sum_i\alpha(x,x_i)y_i f(x)=∑iα(x,xi)yi 其中 α ( x , x i ) \alpha(x,x_i) α(x,xi)是注意力权重
-
NW核回归 注意对x接近的key K是核函数,离得越近越大
f ( x ) = ∑ i = 1 n K ( x − x i ) ∑ j = 1 n K ( x − x j ) y i f(x)=\sum_{i=1}^n\frac{K(x-x_i)}{\sum_{j=1}^nK(x-x_j)}y_i f(x)=i=1∑n∑j=1nK(x−xj)K(x−xi)yi
-
当使用高斯核 K ( u ) = 1 2 π exp ( − u 2 2 ) K(u)=\frac1{\sqrt{2\pi}}\exp(-\frac{u^2}2) K(u)=