http://blog.youkuaiyun.com/huyoo/article/details/12188573
http://www.zhihu.com/question/19842722
https://github.com/fxsjy/jieba
http://ictclas.org
ICTCLAS 汉语词性标注集
汉语文本词性标注标记集
Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。
a 形容词 取英语形容词adjective的第1个字母。
ad 副形词 直接作状语的形容词。形容词代码a和副词代码d并在一起。
an 名形词 具有名词功能的形容词。形容词代码a和名词代码n并在一起。
b 区别词 取汉字“别”的声母。
c 连词 取英语连词conjunction的第1个字母。
Dg 副语素 副词性语素。副词代码为d,语素代码g前面置以D。
d 副词 取adverb的第2个字母,因其第1个字母已用于形容词。
e 叹词 取英语叹词exclamation的第1个字母。
f 方位词 取汉字“方”
Python中文分词与汉语词性标注

本文介绍了Python中进行中文分词和词性标注的相关资源,包括NLTK库、jieba分词、ICTCLAS汉语词性标注集等,并展示了汉语文本处理的基本操作,如词性标注代码解释。
最低0.47元/天 解锁文章
999

被折叠的 条评论
为什么被折叠?



