2019-05-06 文件操作 读一个文件,包含英文句子,请统计共多少个不重复的单词

博客主要围绕读取包含英文句子的文件展开,目标是统计文件中不重复单词的数量,并将每个单词及其出现次数打印到另一个文件中,涉及Python文件操作和数据统计。

#读一个文件,包含英文句子,请统计共多少个不重复的单词
#并且在另外一个文件中打印每个单词以及它的出现的次数

with open('/Users/jianpengwang/Desktop/宋华杰/123.txt','r') as f:
	f.seek(0)
	norepeat_word_times=0
	norepead_word=[]
	result={}
	
	for line in f.readlines():
		line_list=line.strip('\n').split(' ')
		for word in  line_list:
			if line_list.count(word)==1:
				norepead_word.append(word)
				norepeat_word_times+=1
			if word not in result:
				result[word]=1
			else:
				result[word]+=1

print('不重复的英文单词个数为:',norepeat_word_times)
print('不重复的英文单词为:',norepead_word)

with open('/Users/jianpengwang/Desktop/宋华杰/123result.txt','w+',encoding='utf-8') as f1:

	for k,v in result.items():
		f1.write('%s出现的次数为:%d'%(k,v))
		f1.write('\n')
		print('%s出现的次数为:%d'%(k,v))
		





 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值