文章目录
1. BiLSTM-CRF命名实体识别概要
假设有一个数据集,其中有两个实体类型,Person和Organization。但是,事实上,在我们的数据集中,我们有5个实体标签
B-Person
I- Person
B-Organization
I-Organization
O
设x是一个包含5个单词的句子:w0,w1,w2,w3,w4
。在句子x中,[w0,w1]是一个Person实体,[w3]是一个Organization实体,其他都是“O”
1.1 模型介绍
BiLSTM-CRF模型总体结构图如图1所示
- 首先,将句子x中的每个单词表示为一个向量,其中包括单词的嵌入和字符的嵌入。字符嵌入是随机初始化的。词嵌入通常是从一个预先训练的词嵌入文件导入的。所有的嵌入将在训练过程中进行微调。
- 第二,BiLSTM-CRF模型的输入是这些嵌入,输出是句子x中的各个单词的预测标签的分数。如图2所示,BiLSTM层的输出是每个标签的分数。例如,对于w0, BiLSTM节点的输出为1.5 (B-Person)、0.9 (I-Person)、0.1 (B-Organi