word_list = jieba.cut('对比一下jieba中的cut函数与lcut函数的区别')
这样print(word_list) 得到是 <generator object Tokenizer.cut at 0x0000025E90D1C190>
如果想得到分词后的结果 print(('|'.join(word_list)))
得到结果 对比|一下|jieba|中|的|cut|函数|与|lcut|函数|的|区别
而
word_list_lcut = jieba.lcut('对比一下jieba中的cut函数与lcut函数的区别', cut_all=False)
可以直接得到分词后的结果字符串
['对比', '一下', 'jieba', '中', '的', 'cut', '函数', '与', 'lcut', '函数', '的', '区别']
import jieba
word_list = jieba.cut('对比一下jieba中的cut函数与lcut函数的区别')
word_list_lcut = jieba.lcut('对比一下jieba中的cut函数与lcut函数的区别', cut_all=False)
print(word_list)
print(('|'.join(word_list)))
print(word_list_lcut)

本文通过实例对比了jieba分词库中cut与lcut两个函数的功能与使用方法。cut函数返回一个生成器,需进一步处理才能获取分词结果;lcut函数直接返回分词后的列表结果,便于后续操作。
8586

被折叠的 条评论
为什么被折叠?



