初始优化式
PAMM(Perception Algorithm using Measures as Margins) 怎么翻译呢,用评价标准作为边界的感知算法。
实际是
其中 X 为文本集, y为实际结果,J为期望结果,E为评价标准的返回值,取值范围[0, 1]。
第一步转化
作者先通过一步转化,转化为
右边中括号表示满足条件为1,否则为0.
doc relationship为R, F为ranking model的输出值
第二步转化
再进一步转化,转化为(上界)
中括号依旧表示 满足为1 不满足为0
F的形式
E是我们评价标准得到的值,F为模型得到的值,为了让这个条件尽量满足,正样本F要尽可能比负样本F大,因此我们可以最优化这个:
F的形式可以采用最大似然,即
正负样本的生成
正负样本总数为M!个,M为doc数
首先生成正样本,先找出一个正样本加入正样本集,交换该样本中doc的E相同 即评分值相同的两个doc(一个在该正样本集合内,一个外),若不在正样本集中,则加入,迭代一定次数后停止
负样本则先随机生成,满足不在正样本中且其样本的E满足一定条件(如<0.8)的加入负样本集