自然语言处理中的句子结构理解
1. 词素分类
词素分类能让我们了解形态分析的整体概念。词素主要分为两类:
1.1 自由词素
自由词素可以单独作为一个词存在,也被称为无约束词素或独立词素。例如:
- Dog
- Cats
- Town
- House
这些词可以与其他词组合使用,组合后的含义与单个词的含义不同,如“Doghouse”“town hall”。
1.2 粘着词素
粘着词素通常带有词缀,进一步分为两类:
- 派生词素 :当词中缀与词根结合并改变语义时,就会出现派生词素。例如,“unkind”中的“un”是前缀,“kind”是词根,“un”改变了“kind”的意思;“happiness”中,“-ness”是派生词素,将“happy”变为“happiness”,且词性从形容词变为名词。
- 屈折词素 :屈折词素是添加到单词上以赋予其特定语法属性的后缀,是表示时态、数量、词性等的语法标记。例如,“dogs”中的“-s”将“dog”从单数变为复数;“expected”中的“-ed”改变了动词时态。
以下是使用 nltk 和 polyglot 库从词素生成词干的代码链接: https://github.com/jalajthanaki/NLPyt
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



