2019-05-06 文件操作读一个文件，包含英文句子，请统计共多少个不重复的单词

原创于 2019-05-07 00:09:40 发布 · 338 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

python 同时被 2 个专栏收录

30 篇文章

订阅专栏

python3文件操作

9 篇文章

订阅专栏

博客主要围绕读取包含英文句子的文件展开，目标是统计文件中不重复单词的数量，并将每个单词及其出现次数打印到另一个文件中，涉及Python文件操作和数据统计。

#读一个文件，包含英文句子，请统计共多少个不重复的单词
#并且在另外一个文件中打印每个单词以及它的出现的次数

with open('/Users/jianpengwang/Desktop/宋华杰/123.txt','r') as f:
	f.seek(0)
	norepeat_word_times=0
	norepead_word=[]
	result={}
	
	for line in f.readlines():
		line_list=line.strip('\n').split(' ')
		for word in  line_list:
			if line_list.count(word)==1:
				norepead_word.append(word)
				norepeat_word_times+=1
			if word not in result:
				result[word]=1
			else:
				result[word]+=1

print('不重复的英文单词个数为：',norepeat_word_times)
print('不重复的英文单词为：',norepead_word)

with open('/Users/jianpengwang/Desktop/宋华杰/123result.txt','w+',encoding='utf-8') as f1:

	for k,v in result.items():
		f1.write('%s出现的次数为：%d'%(k,v))
		f1.write('\n')
		print('%s出现的次数为：%d'%(k,v))