snips采用BILOU标记模式
BILOU 标记模式对数据进行标记的方式如下:
B stands for ‘beginning’ (signifies beginning of an NE)
I stands for ‘inside’ (signifies that the word is inside an NE)
O stands for ‘outside’ (signifies that the word is just a regular word outside of an NE)
L stands for ‘last’ (signifies that the last word of an NE)
U stands for ‘unit’(signifies that the single word is an NE )
NE:named Entity 命名实体
命名实体(named entity)所谓的命名实体就是人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的实体还包括数字、日期、货币、地址等等。
B - 'beginning'
I - 'inside'
L - 'last'
O - 'outside'
U - 'unit'

snips中的一个例子:
listen to westbam alumb allergic on google music
O O B-artist O B-album O B-service I-service
BILOU标记法用于命名实体识别,其中B表示开始,I表示内部,O表示外部,L表示最后一个,U表示单一单元的命名实体。例如在snips中,'westbam'被标记为B-artist,'alumb'为B-album,'google music'中的'google'为B-service,'music'为I-service。
1823

被折叠的 条评论
为什么被折叠?



