Lucene.net+盘古分词:如何做到按需分词,新增盘古分词词库

本文介绍如何通过自定义词库来改进盘古分词器的性能,特别针对电子商务产品名称的搜索需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近做了一个小商城,用到了Lucene+盘古,但是发现,盘古的默认分词词库不够全,有很多词都没有分到位,为了这个,研究了一上午,做记录如下

第一步:设置词库

自己可以把自己想要词写成一个txt保存起来,我因为做的是淘宝商品类的检索,所以我直接在搜狗词库里面检索到了阿里巴巴的所有词库,直接通过工具转换成了txt格式的

第二步:通过盘古DictManage.exe设置要添加的词

第三步:添加PanGu.dll的引用

第四步:把PanGu.xml放到bin目录里面

第五步:把Dictionaries文件夹下所有的内容放到网站根目录里面


通过以上五步,就可以使用新增的词进行分词了,如果以后需要继续添加词,只需要按前2步添加完成之后,把Dictionaries/Dict.dct替换进去即可


第一步所需工具链接:http://download.youkuaiyun.com/detail/lzlawy1314/9837402

2-5步所需工具链接:http://download.youkuaiyun.com/detail/lzlawy1314/9837413

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值