原理这里就不赘述了。见参考链接4
说一些自己学习时困惑的地方,如果有不对的地方,还望各位评论指正。
下面从w的求解开始说起,下面是模型的对数似然函数:
Ψ ( w ) = ∑ x , y P ~ ( x , y ) ∑ i = 1 n w i f i ( x , y ) − ∑ x P ~ ( x ) l o g Z w ( x ) \Psi (w)=\sum_{x,y} \tilde P(x,y)\sum_{i=1}^{n}w_if_i(x,y)-\sum_{x} \tilde P(x)logZ_w(x) Ψ(w)=x,y∑P~(x,y)i=1∑nwifi(x,y)−x∑P~(x)logZw(x)
困惑1:怎么表示式子中特征函数的 f f f?
书上说特征函数可描述输入x和输出y之间的某一事实,我预想的是构造一个特征函数列表,列表中每一个元素都是一个形如 f ( x , y ) f(x,y) f(x,y)的函数,例如我构造一个特征函数为x的第一个字母为大写y为1,则在列表中加入一个函数lambda x,y : x[0].isupper() and y == 1
,每次需要计算 ∑ i = 1 n w i f i ( x , y ) \sum_{i=1}^{n}w_if_i(x,y) ∑i=1nwi