按照人民日报的分词标准训练
参照:
a 形容词 b 区别词 d 副词 f 方位词 g 语素词 i 成语 j 简略词 k 后接成分 l 习用语 m 数词 n 名词
o 拟声词 p 介词 q 量词 r 代词 s 处所词 t 时间词 u 助词 v 动词 w 标点符号 x 非语素词
y 语气词 z 状态词 c 连词 e 叹词 h 前接成分
| 标记 | 解释 |
|---|---|
| a | 形容词 |
| b | 区别词 |
| c | 连词 |
| d | 副词 |
| e | 叹词 |
| f | 方位词 |
| g | 语素词 |
| h | 前接成分 |
| i | 成语 |
| j | 简略语 |
| k | 后接成分 |
| l | 习用语 |
| m | 数词 |
| n | 名词 |
| o | 拟声词 |
| p | 介词 |
| q | 量词 |
| r | 代词 |
| s | 处所词 |
| t | 时间词 |
| u | 助词 |
| v | 动词 |
| w | 标点符号 |
| x | 非语素词 |
| y | 语气词 |
| z | 状态词 |
在表中列出所有类别的词汇标记,有的词可以活用,比如:vn,动词作名词,vd,动词作副词,an,形容词作名词,ad,形容词作副词等。
还有些特殊的名词:
人名:nr
地名:ns
机构团体:nt
外文字符:nx
下面是1998年的人民日报部分标注

自然语言处理之词性标注集:https://blog.youkuaiyun.com/diyiday/article/details/87940222
nlp-形式语言与自动机-ch07-自动分词、命名实体识别与词性标注:https://blog.youkuaiyun.com/h_jlwg6688/article/details/69374902
B站相关视频:https://www.bilibili.com/video/av37626570/?p=31
1998年人民日报标注数据集:https://pan.baidu.com/s/1waV8rPMuegUOAm7DlnXYUQ 提取码:fa7j
本文介绍人民日报采用的词性标注标准及分类,包括形容词、区别词等多种词性标记,并提供1998年人民日报部分标注数据集链接,用于自然语言处理领域的研究与实践。
837

被折叠的 条评论
为什么被折叠?



