统计序列中元素出现的频度

本文介绍两种统计序列中元素频度的方法:一种是通过构建字典并排序找到最高频元素;另一种是利用Python标准库collections.Counter快速实现。此外,还展示了如何对英文文本进行词频统计并获取最常见单词。

统计序列中元素出现的频度

案例1:
随机序列[1,2,3,4,44,2,3,8...]中,找出次数出现最高的3个元素,并统计他们出现的次数。

# eg_v1

from random import randint

data = [randint(1, 20) for _ in range(30)]
print(data)
# [19, 15, 4, 18, 18, 7, 18, 13, 18, 20, 18, 3, 5, 6, 7, 19, 2, 15, 3, 6, 13, 4, 14, 20, 1, 18, 13, 2, 11, 4]
c = dict.fromkeys(data,0)
for x in data:
c[x] += 1
print (c)
# {1: 1, 2: 2, 3: 2, 4: 3, 5: 1, 6: 2, 7: 2, 11: 1, 13: 3, 14: 1, 15: 2, 18: 6, 19: 2, 20: 2}
d = sorted(c.items(),key= lambda asd:asd[1])
print (d)
# [(1, 1), (5, 1), (11, 1), (14, 1), (2, 2), (3, 2), (6, 2), (7, 2), (15, 2), (19, 2), (20, 2), (4, 3), (13, 3), (18, 6)]

  

# eg_v2 使用字典中collections.Counter 方法

"""
将序列传入Counter的构造器,得到Counter方法就是元素词频的字典
Counter.most_common(n) 方法得到最高的n个元素的列表
"""
from random import randint
from collections import Counter

data = [randint(1, 20) for _ in range(30)]
print (data)
# [5, 13, 2, 9, 9, 20, 10, 9, 1, 14, 10, 1, 9, 12, 14, 3, 8, 20, 10, 7, 10, 4, 7, 18, 15, 10, 17, 5, 5, 16]
c2 = Counter(data)
print (c2)
# Counter({10: 5, 9: 4, 5: 3, 1: 2, 7: 2, 14: 2, 20: 2, 2: 1, 3: 1, 4: 1, 8: 1, 12: 1, 13: 1, 15: 1, 16: 1, 17: 1, 18: 1})
n = c2.most_common(3)
print (n)
# [(10, 5), (9, 4), (5, 3)]

  


案例2:
对某英文文章的单词进行词频统计,找出出现次数最多的10个单词,它们出现的次数是多少。

import re
from collections import Counter

file_txt = open("Alice.txt").read()
# print (file_txt)
rst = re.split("\s",file_txt) # 匹配任何空白字符,包括空格、制表符、换页符等。与 [ \f\n\r\t\v] 等效
# print(rst)
c3 = Counter(rst)
# print (c3)
c4 = c3.most_common(10)
print (c4)
# [('I', 31), ('the', 13), ("I'll", 11), ('When', 8), ('stop', 6), ('down', 6), ('me', 5), ('myself', 5), ('get', 5), ('to', 5)]

  

 

转载于:https://www.cnblogs.com/xieshengsen/p/7190137.html

标题基于Python的自主学习系统后端设计与实现AI更换标题第1章引言介绍自主学习系统的研究背景、意义、现状以及本文的研究方法和创新点。1.1研究背景与意义阐述自主学习系统在教育技术领域的重要性和应用价值。1.2国内外研究现状分析国内外在自主学习系统后端技术方面的研究进展。1.3研究方法与创新点概述本文采用Python技术栈的设计方法和系统创新点。第2章相关理论与技术总结自主学习系统后端开发的相关理论和技术基础。2.1自主学习系统理论阐述自主学习系统的定义、特征和理论基础。2.2Python后端技术栈介绍DjangoFlask等Python后端框架及其适用场景。2.3数据库技术讨论关系型和非关系型数据库在系统中的应用方案。第3章系统设计与实现详细介绍自主学习系统后端的设计方案和实现过程。3.1系统架构设计提出基于微服务的系统架构设计方案。3.2核心模块设计详细说明用户管理、学习资源管理、进度跟踪等核心模块设计。3.3关键技术实现阐述个性化推荐算法、学习行为分析等关键技术的实现。第4章系统测试与评估对系统进行功能测试和性能评估。4.1测试环境与方法介绍测试环境配置和采用的测试方法。4.2功能测试结果展示各功能模块的测试结果和问题修复情况。4.3性能评估分析分析系统在高并发等场景下的性能表现。第5章结论与展望总结研究成果并提出未来改进方向。5.1研究结论概括系统设计的主要成果和技术创新。5.2未来展望指出系统局限性并提出后续优化方向。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值