【python,hanlp】pyhanlp分词如何加入自定义词典

本文介绍了如何在PyHanLP中配置自定义词典,包括在虚拟环境和真实环境中查找安装位置,并修改配置。删除CustomDictionary.txt.bin后,重新运行程序即可使用自定义词典进行分词。此过程适用于需要针对特定领域优化分词效果的场景。

step1:首先找到pyhanlp的安装位置

这里分两种情况:
1、安装位置在虚拟环境

E:\apps\Anaconda3\envs\dome\Lib\sitepackages\pyhanlp\static\data\dictionary\custom

envs文件夹下面存放的就是python编译器所有的虚拟环境列表,这里我使用的是dome虚拟环境,按照这种格式”虚拟环境->Lib->site-packages->pyhanlp->static->data->dictionary->custom“一步一步找到词典存放位置,可以将自定义词典放在此文件夹下面。比如下图的:金融词库.txt就是我的金融行业的自定义词典。加入词典之后,便可以进行下一步操作,这里我的自定义词典仅仅有词没有词性和词频。一词一行行与行之间没有空格,词顶行排列,行尾没有多余的空格符。
在这里插入图片描述
在这里插入图片描述
2、未使用虚拟环境
在这里插入图片描述
没有安装虚拟环境下,而在真实环境安装pyhanlp的小伙伴直接按照上图找到site-packages目录按照Lib->site-packages->pyhanlp->static->data-&

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值