语言基础:从词类到语义的全面解析
在自然语言处理(NLP)领域,掌握基本的语言学概念至关重要。这些概念不仅有助于理解语言的结构和规则,还能为NLP任务提供坚实的理论基础。本文将深入探讨词类、形态学、句法结构、语义和语用学等方面的知识。
1. 词类与形态学
词类是语言中对单词进行分类的基本方式。常见的词类包括名词、动词、形容词等。语言学家将具有相似句法行为和语义类型的单词归为一类,这些词类也被称为句法或语法范畴,更常见的名称是词性(POS)。
- 开放词类与封闭词类 :词类通常分为开放词类和封闭词类。开放词类如名词、动词和形容词,成员众多,且不断有新词汇加入;封闭词类如介词和限定词,成员较少,且语法功能明确。例如,在“Children eat sweet candy”中,“children”和“candy”是名词,“eat”是动词,“sweet”是形容词。
- 词性标注 :为了更精确地描述词类,语料库语言学家通常使用更细致的分类和缩写,即词性标签(POS tags)。例如,在布朗语料库中,形容词用“JJ”表示,名词用“NN”表示。
- 形态学过程 :形态学研究单词的构成和变化。主要的形态学过程包括屈折变化、派生和复合。屈折变化通过词缀来表示语法区别,如名词的复数形式;派生通常会导致句法范畴和意义的更显著变化,如形容词派生为副词;复合是将两个或更多单词合并成一个新单词,如“tea kettle”。
| 形态学过程 |
|---|
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



