文章的主要贡献 metric scaling 在将距离d输入到softmax层之前,乘以一个系数α\alphaα,这样使得余弦和欧式距离区分度不那么明显,也使得模型的适应性更强;文中将α\alphaα分为两种情况讨论:即α→0\alpha\to0