Python 合并多个TXT文件并统计词频!

该博客介绍了如何使用Python读取多个TXT文件,合并内容到新文件,并对新文件进行词频统计,以找出出现最多的10个单词。示例代码在Windows 10和Python 3.7.4环境下运行成功。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求是:针对三篇英文文章进行分析,计算出现次数最多的 10 个单词

逻辑很清晰简单,不算难, 使用 python 读取多个 txt 文件,将文件的内容写入新的 txt 中,然后对新 txt 文件进行词频统计,得到最终结果。

代码如下:(在Windows 10,Python 3.7.4环境下运行通过)

Python资源共享群:626017123

# coding=utf-8
import re
import os
# 获取源文件夹的路径下的所有文件
sourceFileDir = 'D:\\Python\\txt\\'
filenames = os.listdir(sourceFileDir)
# 打开当前目录下的 result.txt 文件,如果没有则创建
# 文件也可以是其他类型的格式,如 result.js
file = open('D:\\Python\\result.txt', 'w')
# 遍历文件
for filename in filenames:
    filepath = sourceFileDir+'\\'+filename
    # 遍历单个文件,读取行数,写入内容
    for line in open(filepath):
        file.writelines(line)
        file.write('\n')
# 关闭文件
file.close()
# 获取单词函数定义
def getTxt():
    txt = open('result.txt').read()
    txt = txt.lower()
    txt = txt.replace('’', '\'')
    # !"@#$%^&*()&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值