- 说明:这部分是统计自然语言处理中比较重要的部分,目前作为了解,会其意,有时间再补充细节,知其行。
- 条件随机场CRF,conditional random field。
- CRF中的特征函数
- CRF与逻辑回归的比较:条件随机场是逻辑回归的序列化版本。
- CRF与HMM比较:
(1)每一个HMM模型都等价于某个CRF。对于HMM中的每一个转移概率,CRF都可以构造一个特征函数,并使其权重为HMM中log形式的转移概率,同理,对于HMM中的每一个发射概率(或输出概率或观测概率),CRF都可以构造一个特征函数,并使其权重为HMM中log形式的发射概率。
(2)CRF要比HMM更加强大,原因:
a. CRF可以定义数量更多,种类更丰富的特征函数。
b. CRF可以使用任意的权重。 - 线性链CRF:特征函数仅仅依靠当前单词的标签和它前面的单词的标签对标注序列进行评判。