import jieba
try:
f1 = open('wiki.zh.text.jian','r')
f2 = open('2.txt','w')
mystr = f1.readlines()
iters = 1
for word in mystr:
seg_list = jieba.cut(word)
result = ' '.join(seg_list)
f2.write(result)
print('处理完成%d行'%(iters))
iters+=1
#print(mystr[0])
finally:
if f1:
f1.close()
if f2:
f2.close()
Python3使用jieba分词
最新推荐文章于 2023-05-30 00:11:51 发布
本篇博客介绍了一个简单的Python脚本,该脚本利用jieba分词工具对中文文本进行分词处理。通过读取文件内容并对每一行进行分词操作,最终将分词结果写入到新的文件中。此过程展示了基本的文件读写和jieba库的使用方法。
7838

被折叠的 条评论
为什么被折叠?



