《Queries and interfaces》

query 的停用词和词干分析

停用词比较简单,就是一些简单的单词,如to,for等词。但是单这些单词在一些特殊的组合中的时候是不能去除的。

词干分析:就是把一些单词的名词复数、形容词归一化的简单的名称。但是这种也有特殊情况,有的是不能简单的归一化的。这些词的复数或者ing形式一般会表示一些特殊的意义。
拼写纠错:拼写纠错一般的方法就是通过编辑距离来的。不过对于英文来说有一些规则:如果首字母很少修改;单词的长度不变。
当拼写纠错可能找到多种可能的时候,通过频率降序排列。把可能性大的放在最前面。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值