python--统计列表中的中文词语频数

本文介绍了如何在Python中统计列表中的中文词语频数,包括处理普通列表和嵌套列表的情况。在处理嵌套列表时,需要先将其扁平化以避免哈希错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

普通列表

  • 代码
words=['汇源果汁', '可口可乐', '汇源果汁', '露露', '汇源果汁'] #列表
count={} #空元组
for item in words:
    count[item]=count.get(item,0)+1 #get 查找键 item
print(count)

#结果:{'汇源果汁': 3, '可口可乐': 1, '露露': 1}

嵌套列表

  • 先把嵌套列表扁平化,再进行上面普通列表的操作,否则就会报错–不可哈希
  • 报错情况
words=[['汇源果汁'],[ '可口可乐'],['汇源果汁'] , ['露露'], ['汇源果汁']] #两层嵌套列表
count={} #空元组
for item in words:
    count[item]=count.get(item,0)+1 #get 查找键 item
print(count)

在这里插入图片描述

  • 拆掉嵌套列表后可行
words=[['汇源果汁'],[ '可口可乐'],['汇源果汁'] , ['露露'], ['汇源果汁']] #两层嵌套列表
rwords=[brand for drink in words for brand in drink] #将列表扁平化
count={} #空元组
for item in rwords:
    count[item]=count.get(item,0)+1 #get 查找键 item
print(count)

#结果:{'汇源果汁': 3, '可口可乐': 1, '露露': 1}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值