import jieba
# import jieba.analyse
string = "人人编程时我们,适合编程初学者学习python的教材,也是好专业的童鞋关注学习"
sl = jieba.cut(string, cut_all=True)
print('全的模式:', list(sl))
sl = jieba.cut(string, cut_all=False)
print("精确模式:", list(sl))
sl = jieba.cut(string)
print('搜索模式:', list(sl))
# 自定义词
print()
string = "我是巴拉巴拉小魔仙"
sl = jieba.cut(string)
print('自定义前:', list(sl))
add = '巴拉巴拉'
print('添加自定义词:{}'.format(add))
jieba.add_word(add)
sl = jieba.cut(string)
print('自定义后:', list(sl))
# 自定义词库
print()
string = "我们python人, play snake"
sl = jieba.cut(string)
print('自定义词库前:', list(sl))
jieba.load_userdict('./renren_dict.txt')
sl = jieba.cut(string)
print('自定义词库后:', list(sl))
# 切换词库
print()
jieba.set_dictionary("./renren_dict.txt")
sl = jieba.cut(string)
print('自定义词库路径后:', list(sl))
Building prefix dict from the default dictionary ...
Loading model from cache /var/folders/c9/x_d7fp691xlb1yfr8g4dq35w0000gn/T/jieba.cache
Loading model cost 1.646 seconds.
Prefix dict has been built succesfully.
全的模式: ['人人', '编程', '时', '我们', '', '', '适合', '合编', '编程', '初学', '初学者', '学者', '学习', 'python', '的', '教材', '', '', '也', '是', '好', '专业', '的', '童鞋', '关注', '学习']
精确模式: ['人人', '编程', '时', '我们', ',', '适合', '编程', '初学者', '学习', 'python', '的', '教材', ',', '也', '是', '好', '专业', '的', '童鞋', '关注', '学习']
搜索模式: ['人人', '编程', '时', '我们', ',', '适合', '编程', '初学者', '学习', 'python', '的', '教材', ',', '也', '是', '好', '专业', '的', '童鞋', '关注', '学习']
自定义前: ['我', '是', '巴拉巴', '拉小', '魔仙']
添加自定义词:巴拉巴拉
自定义后: ['我', '是', '巴拉巴拉', '小', '魔仙']
自定义词库前: ['我们', 'python', '人', ',', ' ', 'play', ' ', 'snake']
Building prefix dict from /Users/xxx/PycharmProjects/For_testing/renren_dict.txt ...
Loading model from cache /var/folders/c9/x_d7fp691xlb1yfr8g4dq35w0000gn/T/jieba.ud8a8e3f166da6918462abb03ae939b26.cache
自定义词库后: ['我们', 'python人', ',', ' ', 'play', ' ', 'snake']
Loading model cost 0.034 seconds.
自定义词库路径后: ['我们', 'python人', ',', ' ', 'play', ' ', 'snake']
Prefix dict has been built succesfully.