知乎上一篇帖子“有什么相见恨晚的背单词方法?”提到学好英语首先要过7000单词词汇量这道关,而网上看到很多关于“100个句子背7000单词”的故事。可当我下载这100个句子后感觉这里远远没有7000个单词。因而就想用python来确认一下 自己的感觉是否正确。
下面用Python写了几行代码来统计这100个句子到底有多少单词。
100个句子已经下载,若没有下载或感兴趣的朋友可以查看这里 100个句子背7000单词...
代码实现单词统计的简单分析:
1. 读取文件内容,直接使用open()函数
2. 文件内容可能不完全是英语,因而需要提取英语单词,这里采用正则方式来提取
3. 提取单词后生成一个列表,这样便于统计
代码如下: 也可以直接访问Github获得全部代码和数据