第三次课后作业

最新推荐文章于 2025-09-10 17:59:49 发布

转载最新推荐文章于 2025-09-10 17:59:49 发布 · 99 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/qishan6666/p/10666638.html

文章标签：

#python

本文介绍了一个简单的Python脚本，用于统计文本文件中单词出现的频率，并展示如何通过代码优化提升性能。通过使用标准库和命令行参数，该脚本能够方便地处理指定文件并输出最常见的十个单词。

学号:2017*****7154；姓名：齐山码云项目仓库：https://gitee.com/qishan66/project/tree/master

代码；

from string import punctuation def process_file(dst):3 try: f = open(dst) except IOError, s: print s return None try: bvffer = f.read() except: print "Read File Error!" return None f.close() return bvffer

def process_buffer(bvffer): if bvffer: word_freq = {} for item in bvffer.strip().split(): word = item.strip(punctuation+' ') if word in word_freq.keys(): word_freq[word] += 1 else: word_freq[word] = 1 return word_freq

def output_result(word_freq): if word_freq: sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True) for item in sorted_word_freq[:10]: print item

if __name__ == "__main__": import argparse parser = argparse.ArgumentParser() parser.add_argument('dst') args = parser.parse_args() dst = args.dst bvffer = process_file(dst) word_freq = process_buffer(bvffer) output_result(word_freq)

在命令中输入python word_freq.py Gone_with_the_wind.txt运行代码