python 把myinput.txt中的文字分词，保存在myoutput.txt中，并制成图片

最新推荐文章于 2023-01-06 14:11:34 发布

unikran2018

最新推荐文章于 2023-01-06 14:11:34 发布

阅读量623

点赞数 1

CC 4.0 BY-SA版权

分类专栏： python

本文链接：https://blog.youkuaiyun.com/unikran2018/article/details/79394627

python 专栏收录该内容

23 篇文章

订阅专栏

本文介绍了一种使用Python结合jieba分词库进行文本处理的方法。通过对输入文本进行分词处理并将结果保存至文件，然后利用Pygame将分词后的结果转换成图片形式展示出来。该过程涉及到了文本处理、分词技术和简单的图形界面操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#-*- coding: utf-8 -*-
#code:myhaspl@qq.com
#12-1.py
import sys
reload(sys)
sys.setdefaultencoding("gbk")
sys.path.append("../")
import jieba

def splitSentence(inputFile, outputFile):
    fin = open(inputFile, 'r')                                  #以读的方式打开文件
    fout = open(outputFile, 'w')                                #以写得方式打开文件

    for eachLine in fin:
        line = eachLine.strip().decode('gbk', 'ignore')       #去除每行首尾可能出现的空格，并转为Unicode进行处理
        wordList = list(jieba.cut(line,cut_all=False))                        #用结巴分词，对每行内容进行分词
        outStr = ''
        for word in wordList:
            outStr += word
            outStr +=chr(10)+chr(10)+ ' '
        fout.write(outStr.strip().encode('gbk') + '\n')       #将分词好的结果写入到输出文件

    fin.close()
    fout.close()

splitSentence('myInput.txt', 'myOutput.txt')

import os
import pygame
from pygame.locals import *

pygame.init()
#font = pygame.font.SysFont('SimHei', 14)

fz=open('myOutput.txt','r')

for i,eachLine in enumerate(fz):
       if len(eachLine) > 1 :
        text = eachLine.strip().decode('gbk', 'ignore')       #去除每行首尾可能出现的空格，并转为Unicode进行处理
        font = pygame.font.SysFont('SimHei', 14)
        #print text
        ftext = font.render(text.decode('gbk'), True, (0, 0, 0), (255, 255, 255))
        #print i

        pygame.image.save(ftext,'e:\\picz\\pic\\'+str(i)+' '+eachLine.strip()+'.jpg')

fz.close()