在旧文 Python应用之文本分析 中,其中用到了一个功能是词频统计。当时小编采用的思路是这样的:
需要两个list,一个存储单词,一个存储对应的词频。当遇到一个单词,判断是否在这个list中,如果是,则词频加1;如果否,则单词list新增这个单词,同时对应的词频设置为1。
对应的代码如下:
# 搜寻单词 word 是否在 wordList中
# 若在其中,返回其index; 若不在,返回-1
def getIndex(wordList, word):
index = 0
while index < len(wordList):
if wordList[index] == word:
return index
index = index + 1
return -1