下面整理了NLP的基本任务分类,资料来源见下链接。
https://edu.youkuaiyun.com/course/play/8673
- 词法分析(Lexical Analysis):对自然语言进行词汇层面的分析,是NLP基础性工作
- 分词(Word Segmentation/Tokenization):对没有明显边界的文本进行切分,得到词序列
- 新词发现(New Words Identification):找出文本中具有新形势、新意义或是新用法的词
- 形态分析(Morphological Analysis):分析单词的形态组成,包括词干(Sterms)、词根(Roots)、词缀(Prefixes and Suffixes)等
- 词性标注(Part-of-speech Tagging):确定文本中每个词的词性。词性包括动词(Verb)、名词(Noun)、代词(pronoun)等
- 拼写校正(Spelling Correction):找出拼写错误的词并进行纠正
- 句子分析(Sentence Analysis):对自然语言进行句子层面的分析,包括句法分析和其他句子级别的分析任务
- 组块分析(Chunking):标出句子中的短语块,例如名词短语(N