下面整理了NLP的基本任务分类,资料来源见下链接。
https://edu.youkuaiyun.com/course/play/8673
- 词法分析(Lexical Analysis):对自然语言进行词汇层面的分析,是NLP基础性工作
- 分词(Word Segmentation/Tokenization):对没有明显边界的文本进行切分,得到词序列
- 新词发现(New Words Identification):找出文本中具有新形势、新意义或是新用法的词
- 形态分析(Morphological Analysis):分析单词的形态组成,包括词干(Sterms)、词根(Roots)、词缀(Prefixes and Suffixes)等
- 词性标注(Part-of-speech Tagging):确定文本中每个词的词性。词性包括动词(Verb)、名词(Noun)、代词(pronoun)等
- 拼写校正(Spelling Correction):找出拼写错误的词并进行纠正
- 句子分析(Sentence Analysis):对自然语言进行句子层面的分析,包括句法分析和其他句子级别的分析任务
- 组块分析(Chunking):标出句子中的短语块,例如名词短语(NP),动词短语(VP)等
- 超级标签标注(Super Tagging):给每个句子中的每个词标注上超级标签,超级标签是句法树中与该词相关的树形结构
- 成分句法分析(Constituency Parsing):分析句子的成分,给出一棵树由终结符和非终结符构成的句法树
- 依存句法分析(Dependency Parsing):分析句子中词与词之间的依存关系,给一棵由词语依存关系构成的依存句法树
- 语言模型(Language Modeling):对给定的一

本文梳理了自然语言处理(NLP)的基本任务,包括词法分析、分词、形态分析、词性标注、句子分析、组块分析、句法分析等,并涵盖了语义分析、信息抽取、命名实体识别、情感分析等多个领域的重要概念和技术。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



