第三次作业

最新推荐文章于 2023-07-18 15:39:31 发布

转载最新推荐文章于 2023-07-18 15:39:31 发布 · 45 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/silence587/p/10610163.html

本文介绍了一个简单的文件处理程序，该程序可以读取文件内容，并统计文件中各单词出现的频率，最后输出出现频率最高的十个单词。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2017********7016

吴柏奇

第一段
def process_file(dst): # 读文件到缓冲区
try: # 打开文件
x = open(dst,"r")
except IOError as s:
print (s)
return None
try: # 读文件到缓冲区
bvffer = x.read()
except:
print ('Read File Error!')
return None
x.close()

return bvffer

第二段
def process_buffer(bvffer):
if bvffer:
word_freq = {}
# 下面添加处理缓冲区 bvffer代码，统计每个单词的频率，存放在字典word_freq
for ch in'"!?;,."':
bvffer = bvffer.lower().replace(ch,"")
word = bvffer.strip().split()
for word in word:
word_freq[word] = word_freq.get(word,0)+1

return word_freq

第三段
def output_result(word_freq):
if word_freq:
sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
for item in sorted_word_freq[:10]: # 输出 Top 10 的单词
print(item)

第四段

if __name__ == "__main__":

import argparse
parser = argparse.ArgumentParser()
parser.add_argument('dst')
args = parser.parse_args()
dst = args.dst
bvffer = process_file(dst)
word_freq = process_buffer(bvffer)
output_result(word_freq)

查询单词

最多的次数

我掌握了很多技术

转载于:https://www.cnblogs.com/silence587/p/10610163.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30483495

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

stanford_cs231n第三次作业pretrained_model

03-21

该文件为Stanford_cs231n课程第三次大作业的预训练模型的.h5文件，直接可以load使用。

研究生算法第三次作业第一题 python版

07-07

第三次作业第一题的Python版，是一个针对研究生算法学习者设计的编程练习。在编写Python算法代码的过程中，学生需要熟练使用Python编程语言。Python以其简洁的语法和强大的库支持，在算法设计与分析领域得到了广泛...

参与评论您还未登录，请先登录后发表或查看评论

python统计段落单词词频_Python词频统计

weixin_39787345的博客

11-21

605

1.程序分析，对程序中的四个函数做简要说明。要求附上每一段代码及对应的说明。⑴首先定义def process_file函数，将文件读到缓冲区并关闭，用open（）打开文件、read（）读取文件、close（）关闭文件def process_file(dst): # 读文件到缓冲区try: # 打开文件f1 = open(dst, "r")except IOError as s:pr...

【python 走进NLP】从零开始搭建textCNN卷积神经网络模型

赖德发的博客

09-03

4153

1、众所周知，tensorflow 是一个开源的机器学习框架，它的出现大大降低了机器学习的门槛，即使你没有太多的数学知识，它也可以允许你用“搭积木”的方式快速实现一个神经网络，即使没有调节太多的参数，模型的表现一般还不错。目前，tensorflow 的安装已经变得非常简单，一个简单的 pip install tensorflow 即可，然后 import tensorflow as tf 就能愉快...

Python选择数据结构部分练习

ch的专栏

09-07

3338

练习 13-1 编写一个程序

python学习10-文件处理

阅微草堂的博客

04-12

391

文件处理文件处理就是通过python读入一个txt文件内的数据或者url链接内的数据。比如: 1文件的读取import sys import urllibdef process_file(reader): for line in reader: line=line.strip() print lineif __name__=="__main__":

课后作业3

weixin_30677475的博客

03-27

学号：2017*****7032 姓名：孙鑫宇第一段 def process_file(dst): # 读文件到缓冲区 try: # 打开文件 x = open(dst,"r") except IOError as s: print (s) return None try: # 读文件到缓冲区 ...

江苏开放大学形成性考核作业建筑材料第三次作业.pdf

03-05

江苏开放大学形成性考核作业建筑材料第三次作业.pdf 该资源是江苏开放大学的一份形成性考核作业，主题是建筑材料。该作业共有两部分，第一部分是是非题，第二部分是单项选择题。在是非题部分，共有10道题，涵盖了...

第三次作业已完成！哈哈哈

04-26

【标题】：“第三次作业已完成！哈哈哈” 在信息技术领域，完成作业或项目往往是学习过程中的重要环节，特别是对于编程和实验性的课程来说。这里的“第三次作业”可能指的是一个学生或者团队在学习过程中面临的某个...

吴恩达 machine learning 第三次作业代码

04-11

【吴恩达机器学习课程第三次作业详解】吴恩达（Andrew Ng）是一位世界知名的机器学习专家，他在斯坦福大学和Coursera上开设的“机器学习”课程深受全球学习者欢迎。这次的作业是该课程中的第三次练习，旨在帮助...

python multiprocessing 处理大文件

谁谁谁的的的博客

07-18

559

需要注意的是，以上代码仅提供了一个基本的框架示例。具体的处理逻辑和操作需要根据实际需求进行修改和补充。另外，根据机器的性能和文件的大小，可能需要调整进程池的大小和其它参数来优化处理速度。方法并发处理每一行。最后，通过迭代获取处理后的结果，并进行进一步的操作。函数，用于处理每一行的逻辑。可以根据实际需求进行修改。函数中，我们创建了一个进程池，并使用。模块实现对大文件的多进程处理。在上述代码中，我们定义了一个。在Python中，可以使用。

python生成多级文件夹_利用 python 遍历多级文件夹处理不同文件

weixin_39715652的博客

12-06

362

需求：近期，同事在处理文件的时候，常常需要从一堆文件中提取一些数据信息；分析：由于每个文件夹下面的文件或文件夹多如牛毛，文件类型也很多种，需要针对不同文件类型做处理，人工处理是不现实的，只能用脚本处理了。分析代码：这里定义了一个类 ErgodicFolder，里面有两个方法 process_file 和 ergodic_path_list；process_file：对不同文件类型进行处理；ergo...

Python文件处理

weixin_33895657的博客

04-04

148

读取文件本地文件 input_file = open('note.txt','r') for line in input_file: line = line.strip() #去除前后空格 print(line) input_file.close() 若将其改为函数形式： #filename.py ...

python多线程读取文件内容_在python中使用多线程读取txt文件

weixin_39989973的博客

02-10

1436

小编典典我同意@aix，multiprocessing绝对是要走的路。无论您将如何进行I /O绑定，无论您正在运行多少个并行进程，您都只能读得这么快。但是，很容易被一些加速。考虑以下内容(input /是一个包含来自Gutenberg项目的.txt文件的目录)。import os.pathfrom multiprocessing import Poolimport sysimport time...

软工作业3：个人编程练习--Python统计词频

weixin_30914981的博客

10-09

178

正因为生来什么都没有，因此我们能拥有一切。 --《游戏人生》一、程序分析 1、读文件到缓冲区 1 def process_file(dst): # 读文件到缓冲区 2 try: # 打开文件 3 f = open(dst,'r') 4 except IOError,s: 5 print s...

B站的基于python的Opencv项目实战-唐宇迪.zip