NLP概览(一)

NLP是什么?有哪些应用

NLP即自然语言处理。
主要应用在语音识别、分词、词性标注、关键词提取、概要、句法分析、语义理解与提取、机器翻译、印刷体或手写体识别、拼写错误、汉字输入、文献查询

为什么要分词——词是语义的基本单位

罗马拼音系语言的字词之间天生具有空格,所以分词大多用于象形文件上面,随着欧洲的扩张,使用罗马拼音系的国家非常多,而象形文字,用得最多的无疑是中国了。

中文体现语义的最小单位是词,比如上面的“罗马”,如果你将其分成“罗”“马”,那就失了原意,当然有的字本身就单独成词,如“我爱你”拆分成“我”“爱”“你”是没有什么问题的。


因为词是表达语义的基本单位,所以我们要理解一句话的意思,首先就要经过分词。大家可以找一篇古文来看看,加深一下体会。

 

转载请注明出处 http://www.cnblogs.com/hx78/ 

 

转载于:https://www.cnblogs.com/hx78/p/7298578.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值