爬取txt文件中词频路径
代码如下:
注意事项:
1.修改文件夹路径和保存结果文件路径(空白表格)
2.增添或修改关键词需要在后面按照格式增添或修改两处:sheet.write(0, 12, 'xx')
;keywords =
爬取结果后股票代码和名称未识别是因为txt文件名格式不对,可新建两个空白列,使用ctrl+E一键增添
3.运行代码切勿轻易打开所需要的文件。
# 加载txt列表寻找关键词并保存到excel #coding:utf-8 import os import xlwt def matchKeyWords(txt_folder, keyWords): files = os.listdir(txt_folder) words_num = [] # 保存所有文件词频 for file in files: word_freq = {} # 单词出现频率次:word:num if os.path.splitext(file)[-1] == ".txt": txt_path = os.path.join(txt_folder, file) with open(txt_path, "r", encoding='utf-8', errors='ignore') as fp: text = fp.readlines() for word in keyWords: num = 0