python高级(如何统计序列中元素的出现频率)

本文介绍了两种在Python中统计序列中元素出现频率的方法:使用字典和Counter模块。通过示例展示了如何找到随机序列中出现频率最高的3个元素及其次数,并解释了如何对英文文章进行词频统计,找出出现次数最多的十个单词。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.在随机序列中,找到出现频率次数最高的3个元素,它们各自出现的次数又是多少?

方法一:

from random import randint

data = [randint(0,20) for _ in range(30)]   #导入随机模块,创建一个随机列表

c = dict.fromkeys(data,0)    #字典fromkeys方法创建字典,列表中的每个元素作为字典中的键,0代表出现频率

for x in data:   #循环列表每个元素

   c[x] += 1      #列表中每个元素添加到字典中,代表字典的键,如果遇到有重复的键,键所对应的值,也就是出现频率会加1

from collections import Counter    #导入collections标准库中Counter模块

c2 = Counter(data)        #Counter方法传入字典

print(c2.most_common(3))    #most_common方法传入参数3,打印代表出现频率也就是字典中的值最高的3个键值对。

 

方法二:
from random import randint

data = [randint(0, 20) for _ in range(30)]   #导入随机模块,创建一个随机列表
c = set(data)   #创建集合,参数传入随机列表,把列表重复的元素都给去掉
a = {}      #定义空字典
for i in c:      #先循环集合中不重复的每个元素
    b = []        #定义空列表
    for v in data:    #再循环随机列表中每个元素
        if v == i:   
            b.append(v)     #如果随机列表出现的元素和集合中的元素匹配,就把元素加入到空列表中
            a[i] = len(b)  / a[i] = b.count(v)    #定义字典中的键为集合出现的元素,值为该元素出现在列表中的长度,或计算元素在列表中出现的个数,也即是元素出现的次数统计

new = sorted(a.items(), key=lambda x: x[1], reverse=True)[0:3]   

#利用sorted方法,参数传入字典的键值对进行排序,排序条件的关键值传入匿名函数,自定义x[1]为字典中的值作为条件,再进行从大到小排序,切片取前3个值最高的键值对。

print(new)

 

2.对某英文文章的单词,进行词频统计,找到出现次数最高的十个单词,它们出现的次数是多少?

import re   #导入正则表达式模块

from collections import Counter   #导入collections标准库中Counter模块

txt = open('a.txt') .read()   #打开文件,根据文件名自己改

c3 = Counter(re.split('\W+', txt))   #Counter方法参数传入正则表达式,根据\W匹配任何非单词数字字符进行分割。

print(c3.most_common(10))    取前10条最高记录

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值