Python3使用jieba分词

最新推荐文章于 2023-03-22 20:32:24 发布

原创最新推荐文章于 2023-03-22 20:32:24 发布 · 946 阅读

0 ·

CC 4.0 BY-SA版权

深度学习专栏收录该内容

10 篇文章

订阅专栏

本篇博客介绍了一个简单的Python脚本，该脚本利用jieba分词工具对中文文本进行分词处理。通过读取文件内容并对每一行进行分词操作，最终将分词结果写入到新的文件中。此过程展示了基本的文件读写和jieba库的使用方法。

import jieba

try:
    f1 = open('wiki.zh.text.jian','r')
    f2 = open('2.txt','w')
    mystr = f1.readlines()
    iters = 1
    for word in mystr:
        seg_list = jieba.cut(word)
        result = ' '.join(seg_list)
        f2.write(result)
        print('处理完成%d行'%(iters))
        iters+=1
    #print(mystr[0])

finally:
    if f1:
        f1.close()
    if f2:
        f2.close()