一. CNLP-NLP-简介

本文分享了郑捷老师《NLP汉语自然语言处理原理与实践》的读书心得,涵盖NLP应用领域、主要任务及一般架构,介绍了分词、词性标注、句法解析、命名实体识别等关键技术,并列举了LTP、StanfordNLP等开源系统。

最近在拜读郑捷老师的《NLP汉语自然语言处理原理与实践》,姑且简称CNLP,在阅读的过程中,记录下自己的收获与心得,以便以后翻阅查看。

在这里插入图片描述

  1. 自然语言处理的应用领域:信息检索、信息抽取、数据挖掘、舆情分析、文本摘要、自动问答系统等;
  2. 自然语言处理的主要任务:从最初的对词的研究,发展到现在的对句子的研究,即对句法、句意、以及句子生成的研究,已经能够比较好的解决句子层面的问题,但还没达到解决篇章层面的问题;
  3. 自然语言处理的一般架构
    在这里插入图片描述
  • 左侧是语法层面的模块,包括分词、词性标注与句法解析;右侧偏重语义层面的理解, 命名实体识别主要用来识别语料中的专有名词和未登录词的成词情况,如人名、地名、组织机构名等,其结果受中文分词和词性标注的影响。即命名实体识别是以分词与词性标注位签前提的。
  • 语义组块用来确定一个以上词汇构成的短语结构,即短语级别的标注,主要识别名词性短语、动词性短语、介词短语等。语义组块的识别来源于中文分词、词性标注和命名实体识别的共同信息。即语义组块的识别特征必须包含中文分词、命名实体识别和词性标注。
  • 语义角色标注是以句子中的动词为中心来预测句子中各个语法成分的特征。
  1. 开源的NLP系统举例:LTP, StanfordNLP, FudanNLP, HanLP等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值