三国演义分词-1
题目一:
概述:
'''
《三国演义》是中国古典四大名著之一,曹操是其中主要人物,考生文件夹下文件data.txt给出《三
国演义》简介。
问题1:请编写程序,用Python语言中文分词第三方库jieba对文件data.txt进行分词,并将结果写入文件out. txt,每行一个词,例如:
内容简介
编辑
整个
故事
在
东汉
...
在考生文件夹下给出了程序框架文件PY301-1.py,补充代码完成程序(10分)
'''
思路:
- jieba库导入与文件操作
# 导入jieba(中文分词)库
import jieba
# 打开文件
fp = open('data.txt', 'r')
fw = open('out.txt', 'w')
- 读取文件的每一行,以列表形式返回
lines = fp.readlines()
- 通过循环处理读取的每一条数据
for line in lines:
line = line.strip(' ') # 删除每行首尾可能出现的空格
wordList = jieba.lcut(line) # 用结巴分词,对每行内容进行分词
fw.writelines('