匹配文本中的考纲词汇
在写toefl的英语阅读的时候经常会遇到一些词但是感觉不像考纲里的,一个个查起来很麻烦所以就写了一个抽考纲词汇的python,感觉效果还行
Download
项目地址: fatuity.git
Introduction
- Crawl word list from shanbay.com
- Participle/StopWords/Lemmatizer using nltk
- Match [~toefl] words from text
主要做的一个就是先从扇贝网上把单词列表爬取下来,然后用nltk的包做一下分词,去停用词和词形还原
Tutorial
- put your text in ./src/reading.txt file
- run main.py
- the result will be displayed in result.csv
用法也很简单,先把环境搭建一下,python3即可,然后pip或者easyinstall把包下一下,把文本放入./src/reading.txt路径下的文件里,再跑一下main.py即可,简单的实现了自己的需求,后面如果大家有需求的话可以顺便放服务器上弄个简单的web site,虽然功能很小,但是效果还不错,希望大家一起,好好学英语?