python给字典的元素的值初始化的方法:

本文介绍了一种使用Python统计文本文件中单词出现频率的方法。通过读取指定文件,逐行解析并统计每个单词出现次数,最后输出词频统计结果及运行时间。文章还对比了两种初始化字典值的方法,并推荐使用字典的get方法来提高效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

统计词频:

import time
name = input("Enter file:")
start =time.clock()
if len(name) < 1 : name = "mbox-short.txt"
handle = open(name)
di=dict()
print (di)
for line in handle:
    lines=line.rstrip()
    #print(lines)
    wds= lines.split()
    #print(wds)
    for w in wds:
      #  print(w)   
       di[w]=di.get(w,0)+1
       # print(di[w])
       #print(w)
print (di)
end = time.clock()
print('Running time: %s Seconds'%(end-start))    

python给字典的元素的值初始化的方法:

1. 常规方法 if else

for w in wds:
      if w in di:
            di[w] = di[w]+1
      else:
            di[w] = 1


2. 字典的"get”方法

for w in wds:
    di[w]=di.get(w,0)+1


常用于利用字典统计单词频率



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值