条件随机场的领域自适应与图互增强引导方法
1. 条件随机场(CRFs)基础
条件随机场(CRFs)是一种用于序列数据分割和标注的概率模型,它克服了最大熵马尔可夫模型(MEMMs)可能对后继状态较少的状态产生偏差的问题。
设 $X = x_1…x_n$ 和 $Y = y_1…y_n$ 分别表示通用输入序列和标签序列。图的团现在被限制为仅包含序列中相邻的状态对 $(y_{i - 1}, y_i)$。线性链 CRFs 定义了给定输入序列时状态序列的条件概率为:
[P_{\Lambda}(Y|X) = \frac{1}{Z_x} \exp\left(\sum_{i = 1}^{n} \sum_{k = 1}^{m} \lambda_k f_k(y_{i - 1}, y_i, x, i)\right)]
其中,$Z_x$ 是所有状态序列的归一化因子,$f_k(y_{i - 1}, y_i, x, i)$ 是关于其参数的任意特征函数,$\lambda_k$(范围从 $-\infty$ 到 $\infty$)是每个特征函数的学习权重。特征函数可以是状态特征 $s(y_i, x, i)$ 或转移特征 $t(y_{i - 1}, y_i, x, i)$。
CRF 对于输入序列 $X$ 和标签序列 $Y$ 的全局特征向量为:
[F(Y, X) = \sum_{i} f(y_{i - 1}, y_i, x, i)]
其中 $i$ 遍历输入位置。使用全局特征向量,$P_{\Lambda}(Y|X) = \frac{1}{Z_X} \exp(\Lambda \cdot F(Y, X))$。输入序列 $X$ 的最可能路径 $\hat{Y}$ 为:
[\hat
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



