python使用jieba库进行分词并添加新词

使用jieba进行文本分词与自定义词典
该博客介绍了如何使用jieba库进行中文文本分词,包括全模式、精确模式和自定义词典的使用。通过示例代码展示了如何添加新词并进行分词操作,适用于自然语言处理和文本分析场景。

 因为放各种文字都可能侵权,所以我在代码里就用  x  来代替了,使用时记得先替换成自己需要的文本

import jieba


text='xxxx'            #此处填写文本
print(text)

print('\n\n---------------------cut_all=False----------------------\n')
seq_list=jieba.cut(text,cut_all=False)
print(list(seq_list))

print('\n\n---------------------cut_all=True----------------------\n')
seq_list=jieba.cut(text,cut_all=True)
print(list(seq_list))

print('\n\n---------------------no cut_all----------------------\n')
seq_list=jieba.cut(text,)
print(list(seq_list))


# 添加新词
jieba.add_word('x1')
jieba.add_word('x2')
jieba.add_word('x3')
jieba.add_word('x4')
jieba.add_word('x5')
jieba.add_word('x6')
seq_list=jieba.cut(text,cut_all=False)

print('\n\n---------------------添加新词后----------------------\n')
print(list(seq_list))

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值