文件方式实现完整的英文词频统计实例

本文介绍了一种基于Python的英文小说词频分析方法,通过读取文件、提取单词、排除语法词汇、计数并排序等步骤,实现了对文本中高频词汇的统计。最终输出了TOP20的词汇列表。

可以下载一长篇的英文小说,进行词频的分析。

1.读入待分析的字符串

2.分解提取单词 

3.计数字典

4.排除语法型词汇

5.排序

6.输出TOP(20)

s=open('book.txt','w')
s.write('''New year is the great moment for people, and many families choose to
go to the cinema and enjoy the hour. But recently, the news reported an unhappy
incident that a woman was talking loudly while watching movie and an audience
beat her for anger. The public criticized the woman’s impolite behavior,
though the audience was rude.
The impolite behavior in the cinema happens all the time. When watching the
movie, I really hate people talk, or the kids share opinions with adults.
They are disturbing the audience. Some people don’t talk, but they play smart
phone, showing a light in the dark, it is very uncomfortable. Everybody goes
to the movie to take relax, the one who doesn’t control their behavior will
disturb others.
It is everybody’s duty to self-behave. Parents need to educate their children,
or set the good example to them. Foreigners always complain about the rude
behavior on Chinese people. We have to admit our rude act, only in this way
can we get improved.
''')
s.close() 


print('读取book.txt文件,并将其转化为列表形式提取单词')
b=open('book.txt','r')
read=b.read()
b.close()
read=read.lower()
for i in ',.!?:':
    read=read.replace(i,' ')
words=read.split(' ')#提取单词
print(words)


print('集合转为字典排除语法型词汇并计数字典:')
exp={'','and','the','to'}
keys=set(words)-exp  #键的集合,排除词法型词汇
print(keys)


print('排序:')
dic={}
for w in keys:
    dic[w]=words.count(w)#单词计数字典
wc=list(dic.items())  #单词计数元组的列表
wc.sort(key=lambda x:x[1],reverse=True)#列表排序
print(wc)

print('输出TOP(20):')
for i in range(20):
    print(wc[i])

 

7.对输出结果的简要说明。

 这篇英语文章讲述了要文明观看电影

转载于:https://www.cnblogs.com/33333-/p/7602082.html

(1)普通用户端(全平台) 音乐播放核心体验: 个性化首页:基于 “听歌历史 + 收藏偏好” 展示 “推荐歌单(每日 30 首)、新歌速递、相似曲风推荐”,支持按 “场景(通勤 / 学习 / 运动)” 切换推荐维度。 播放页功能:支持 “无损音质切换、倍速播放(0.5x-2.0x)、定时关闭、歌词逐句滚动”,提供 “沉浸式全屏模式”(隐藏冗余控件,突出歌词与专辑封面)。 多端同步:自动同步 “播放进度、收藏列表、歌单” 至所有登录设备(如手机暂停后,电脑端打开可继续播放)。 音乐发现与管理: 智能搜索:支持 “歌曲名 / 歌手 / 歌词片段” 搜索,提供 “模糊匹配(如输入‘晴天’联想‘周杰伦 - 晴天’)、热门搜索词推荐”,结果按 “热度 / 匹配度” 排序。 歌单管理:创建 “公开 / 私有 / 加密” 歌单,支持 “批量添加歌曲、拖拽排序、一键分享到社交平台”,系统自动生成 “歌单封面(基于歌曲风格配色)”。 音乐分类浏览:按 “曲风(流行 / 摇滚 / 古典)、语言(国语 / 英语 / 日语)、年代(80 后经典 / 2023 新歌)” 分层浏览,每个分类页展示 “TOP50 榜单”。 社交互动功能: 动态广场:查看 “关注的用户 / 音乐人发布的动态(如‘分享新歌感受’)、好友正在听的歌曲”,支持 “点赞 / 评论 / 转发”,可直接点击动态中的歌曲播放。 听歌排行:个人页展示 “本周听歌 TOP10、累计听歌时长”,平台定期生成 “全球 / 好友榜”(如 “好友中你本周听歌时长排名第 3”)。 音乐圈:加入 “特定曲风圈子(如‘古典音乐爱好者’)”,参与 “话题讨论(如‘你心中最经典的钢琴曲’)、线上歌单共创”。 (2)音乐人端(创作者中心) 作品管理: 音乐上传:支持 “无损音频(FLAC/WAV)+ 歌词文件(LRC)+ 专辑封面” 上传,填写 “歌曲信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值