sigir15-PAMM 笔记

初始优化式

PAMM(Perception Algorithm using Measures as Margins) 怎么翻译呢,用评价标准作为边界的感知算法。

实际是min{\sum^N_{n = 1}(1 - E(X^{(n)}, \widehat{y}^{(n)}, J^{(n)})))}

其中 X 为文本集, y为实际结果,J为期望结果,E为评价标准的返回值,取值范围[0, 1]。

第一步转化

作者先通过一步转化,转化为

min \sum^N_{n = 1} \underset{y^+ \in \gamma ^{+(n))} , y^- \in \gamma ^{-(n))}}{max} (E(X^{(n)}, y^+, J^{(n)})) - E(X^{(n)}, y^-, J^{(n)}))) \cdot \left [ F(y^+, X^{(n)}, R^{(n)}) \leq F(y^-, X^{(n)}, R^{(n)}) \right ]

右边中括号表示满足条件为1,否则为0.

doc relationship为R, F为ranking model的输出值

第二步转化

再进一步转化,转化为(上界)

min{ \sum^N_{n = 1} {\sum_{y^+, y^-} \left [ { F(y^+, X^{(n)}, R^{(n)}) - F(y^-, X^{(n)}, R^{(n)}) \leq E(X^{(n)}, y^+, J^{(n)})) - E(X^{(n)}, y^-, J^{(n)})) \right ] }}}

中括号依旧表示 满足为1 不满足为0

F的形式

E是我们评价标准得到的值,F为模型得到的值,为了让这个条件尽量满足,正样本F要尽可能比负样本F大,因此我们可以最优化这个:\underset{\omega _r, \omega _d}{max} \, log \frac{F(X, R, y^+)}{ F(X, R, y^-)}

F的形式可以采用最大似然,即

F(X, R, y) = Pr(y|X, R) = \prod^{M - 1}_{r = 1} Pr(x_{y(r)}| X, S_{r - 1}, R) = \prod ^{M - 1}_{r = 1} \frac{exp \left \{ f_S_{r - 1} (x_i, R_{y(r)}) \right \} }{\sum ^M_{k = r} exp \left \{ f_S_{r - 1} (x_i, R_{y(k)}) \right \}}

 

正负样本的生成

正负样本总数为M!个,M为doc数

首先生成正样本,先找出一个正样本加入正样本集,交换该样本中doc的E相同 即评分值相同的两个doc(一个在该正样本集合内,一个外),若不在正样本集中,则加入,迭代一定次数后停止

负样本则先随机生成,满足不在正样本中且其样本的E满足一定条件(如<0.8)的加入负样本集

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值