最近一直在看吴茂贵老师的《Python深度学习:基于TensorFlow》,前几天看到了概率图模型这一块,讲到了贝叶斯网络和马尔可夫网络等;其中后者主要讲到了马尔可夫随机场和条件随机场,于是今天就动手敲了一遍书中给的代码,讲真,代码有点乱,对于小白来说看着可能会生无可恋,咱们出发吧~~
关于词性标注稍微说明一下,比如给你一个句子:You are beautiful。标准的“主系表”结构,大家都知道系动词不能单独作谓语,其后必须跟表语,其实这就是一种规则,可以称之为一个特征函数,当然这其中还有很多规则,比如动词后边不能跟动词,这也是一个特征函数,我们就可以定义一个特征函数的集合,用来评判一个标注的序列是否正确,这一块的基础知识大家可以自行查阅一下,我们就不一一介绍了,咱们今天主要还是用代码实现它~~
进入正题吧:
1.设置参数
num_exam=10
num_words=20
num_feat=100
num_tags=5
咱们设置了10个样本,每个样本20个单词(不是20的后边统一为20),100个特征函数和5组标注序列,当然这个值可以随意设置,只要合理就o