按出现频率/出现频次从高到低排序，Python算法，人工智能常用，不用import第三方库的方法

最新推荐文章于 2021-11-12 14:15:53 发布

Starblon

最新推荐文章于 2021-11-12 14:15:53 发布

阅读量1.5k

点赞数

文章标签：自然语言处理 python 算法数据分析人工智能

本文链接：https://blog.youkuaiyun.com/qq_41728568/article/details/115621082

版权

本文介绍了一个纯Python实现的算法，用于按关键字出现频率从高到低排序，不依赖任何第三方库。提供了具体代码实现和示例，包括处理空列表和重复值的情况。还设置了一个挑战，要求在已排序的基础上去除重复值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用python的过程中，当我们提取一些关键字词组成集合的时候，往往是杂乱无章的，这时候我们经常需要按照关键字出现的频率从高到低排列。

今天突然想着练练手，上来写点什么，就写一个不依赖第三方库的方法来排序吧，算法仅是实现列表，不需要安装其他库的（后面有个小作业哈，大家可以试一试自己的动手实操能力哦）

# python 算法如下：

def frequency_sort(items): # 用的是items，输入列表，则一个一个元素处理，输入字符串，则一个个字符处理

# your code here

lstBack=[]

MaxCount=0

for i in range(len(items)):

oneCnt=items.count(items[i])

if oneCnt>MaxCount:

MaxCount=oneCnt #这一步找到列表中，最大出现频率的关键词

while MaxCount>=1:

for j in range(len(items)):

if items.count(items[j])==MaxCount:

lstBack.append(items[j])

MaxCount-=1 #按照关键词出现的频次从高到低放到新表中

for i in range(len(lstBack)-1):

for j in range(i

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Starblon

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

华为OD机试指南：多语言实现数组去重和排序算法详解（C++/JavaScript/Java/Python/C）

m0_57781768的博客

11-02

101

本文通过多种编程语言实现了数组去重并排序的算法。该算法思路清晰，首先统计元素的出现频次并记录首次出现位置，之后进行排序，最后按要求格式输出。掌握这类算法思维和多语言实现有助于开发者提升编程逻辑能力和语言灵活性，为华为OD机试等类似考试做好充分准备。

统计字母出现次数从大到小排序

weixin_44219664的博客

05-02

1850

注意！答案仅作为参考（实际考试中下列代码通过用例100%，但不代表最优解）给出一个只包含字母的字符串, 不包含空格,统计字符串中各个子字母(区分大小写)出现的次数, 并按照字母出现次数从大到小的顺序输出各个字母及其出现次数如果次数相同,按照自然顺序排序,且小写字母在大写字母之前输入描述: 输入一行仅包含字母的字符串输出描述: 按照字母出现次数从大到小的顺序输出各个字母和字母次数, 用英文分号分割, 注意末尾的分号字母和次数中间用英文冒号分隔示例: 输入: xyxyXX 输出❌2;y:2;X:2;

参与评论您还未登录，请先登录后发表或查看评论

【Python】【实战】对 excel 某列进行统计，并按出现频率排序

qq_38866586的博客

10-28

9554

文章目录前言1. 源代码2. 模块解析2.1 文件打开2.2 数据读取2.3 频率统计2.4 按频排序前言工作中想对 excel 进行一个简单的统计，历时三个小时终于搞定，效果如下： 1. 源代码话不多说，直接上源码，可以直接食用，只需将目标文件设置为你需要统计的文件即可。 # -*- coding:utf-8 -*- import xlrd from collections import...

Python代码之频率排序（代码原创）

jklove9的博客

08-28

1503

按照数组元素出现频率降序排序（频率一样，那么按照数值大小进行排序）示例如下输入 a = [1,2,2,2,2,2,3,3,4,4,6] 输出: b = [2,2,2,2,2,4,4,3,3,6,1] ''' 分析：如何实现上述功能？第一步：将列表l2进行降序处理，通过调用,sort()方法，由于默认是升序，降序需要加入reverse参数，此步骤的原因后面便会知晓，其目的在于不用判断数值的大小，就可以得到，6,1，而不是1,6 第二步：对列表进行去重，对经过去重之后的列表l中的元素进行频率计算，也

python统计字母出现次数并排序_451. 根据字符出现频率排序（Python）

weixin_39657575的博客

12-03

2660

题目难度：★★☆☆☆类型：字符串方法：统计力扣链接请移步本题传送门更多力扣中等题的解决方案请移步力扣中等题目录给定一个字符串，请将字符串里的字符按照出现的频率降序排列。示例 1:输入:"tree"输出:"eert"解释:'e'出现两次，'r'和't'都只出现一次。因此'e'必须出现在'r'和't'之前。此外，"eetr"也是一个有效的答案。示例 2:输入:"cccaaa"输出:"cccaaa"解释...

根据字符出现频率排序(python)

weixin_40510799的博客

05-07

4136

题目描述：给定一个字符串，请将字符串里的字符按照出现的频率降序排列。示例1：输入：“tree” 输出：“eert” 解释：‘e’出现两次，‘r’和‘t’都只出现一次。因此‘e’必须出现在‘r’和‘t’之前。此外，‘eetr’也是一个有效的答案。示例2：输入：“cccaaa” 输出：“cccaa...

计算单词出现的频次，并按频次从高到低排序

热门推荐

moreharder的博客

11-15

3万+

import collections f=open("D:\python\Walden.txt","r").read() f=f.replace(',','').replace('.','').replace('"','').replace(':','') f=f.split() r=collections.Counter(f) print(r) Counter({'the': 6937, 'and': 4547, 'of': 3472, 'to': 3058, 'a': 2966, 'I': 2

Python cookbook(数据结构与算法)找出序列中出现次数最多的元素算法示例

12-24

在Python编程中，数据结构与算法是至关重要的组成部分，它们能有效地处理和分析数据。本文主要探讨了如何使用Python的`collections`模块中的`Counter`类来找出序列中出现次数最多的元素。`Counter`类是一种专门用于...

python获取信号频率和周期_python时间序列按频率生成日期的方法

weixin_39761880的博客

02-11

713

有时候我们的数据是按某个频率收集的，比如每日、每月、每15分钟，那么我们怎么产生对应频率的索引呢？pandas中的date_range可用于生成指定长度的DatetimeIndex。我们先看一下怎么生成日期范围：pd.date_range(startdate,enddate)1.生成指定开始日期和结束日期的时间范围：In：import pandas as pdindex = pd.date_ran...

python计算字符串单词出现的频率按字母对键进行排序后输出

m0_54782537的博客

01-22

6315

python计算字符串单词出现的频率按字母对键进行排序后输出第一次发不太熟，见谅 d = {} a = input('请输入：') b = list(a.split()) for i in b: d[i] = b.count(i) for a in d: print(a,':',d[a]) ```#以下为运行结果请输入：hello world and practice makes perfect and hello world againpractice !!1111

python数字排序_python 统计数组内数字出现次数，按照次数从大到小，若次数相同，则按照数字从小到大排序...

weixin_39982236的博客

11-23

2208

题目我忘了，大概意思就是文章题目说的，输入第一行输入n是测试样例个数，然后每一个样例，第一行输入length表示数组长度，第二行输入表示数组的每一个元素。比如说：输入：261 1 1 4 2 7101 1 2 2 2 3 3 3 9 5输出：1 1 1 2 4 72 2 2 3 3 3 1 1 5 9写这个题目主要是因为里面包含了python里两个比较好的东西，一个是count，一个是dict按照...

python字符串频次排序_Python按频率排序字符串 – 无法使用sorted()函数排序

weixin_29539039的博客

03-02

695

我有一个问题,按频率排序一个简单的字符串(我得到一个字符串作为输入,我需要将一个排序的字符串作为输出按降序返回).让我举个例子(原始单词包含4个e,2个s,1个t,1个r和1个d;所以这些被排序)：In [1]: frequency_sort("treeseeds")Out [1]: "eeeesstrd"Stack Overflow上的大多数解决方案都说我应该使用sorted()函数来获取我的结...

(Python)字母频率统计

暴力扬

11-12

3632

文章目录【问题描述】【输入形式】【输出形式】【样例输入】【样例输出】【样例说明】【评分标准】【题解】【问题描述】编写程序从标准输入中读入一段英文，统计其中小写字母出现次数，并以柱状图的形式显示其出现次数。【输入形式】在标准输入上输入一段英文文章（可能有一行，也可能有多行），在新的一行的开头输入ctrl+z键表示结束。【输出形式】在屏幕上依次输出表示每个小写字母出现次数的柱状图（以"“字符表示柱状图，空白处用空格字符表示，某个小写字母出现多少次，就显示多少”"字符；柱状图的高度以出现最多的字母次数

根据字符出现的频次排序

Tlwhisper的博客

09-13

899

文章目录1、描述2、关键字&思路4、notes5、复杂度6、code 1、描述给定一个字符串，请将字符串里的字符按照出现的频率降序排列。示例 1: 输入: “tree” 输出: “eert” 解释: 'e’出现两次，'r’和’t’都只出现一次。因此’e’必须出现在’r’和’t’之前。此外，"eetr"也是一个有效的答案。来源：力扣（LeetCode）链接：著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。 2、关键字&思路字符频次，-----> hash

利用Python实现统计大量单词中各字母出现的次数和频率

firm_mabu的博客

03-06

9586

首先以只读方式打开单词文件，利用列表推导式创建两个列表列表sta记录各单词出现的次数，列表freq记录各单词出现的频率

不用第三方模块，只用 python 基础语法，统计单词出现的次数

larry5927的博客

01-25

259

题目统计以下这段文字里，不同单词出现的次数 Beautiful is better than ugly Explicit is better than implicit Simple is better than complex Complex is better than complicated Flat is better than nested Sparse is better than...

Python统计列表中各元素的个数并从高到低排序

dugushangliang的博客

12-15

3314

LeetCode-Python-451. 根据字符出现频率排序

Keep Coding

03-27

1692

给定一个字符串，请将字符串里的字符按照出现的频率降序排列。示例 1: 输入: "tree" 输出: "eert" 解释: 'e'出现两次，'r'和't'都只出现一次。因此'e'必须出现在'r'和't'之前。此外，"eetr"也是一个有效的答案。示例 2: 输入: "cccaaa" 输出: "cccaaa" 解释: 'c'和'a'都出现三次。此外，"aaaccc"也是有效...

Python统计数列中元素出现的次数并进行排序

给我一点温度

08-24

1万+

期望目标：输入：list，例如['d', 'f', 'g', 'f', 'e', 'z', 'f', 'a', 'a'] 输出：list，统计每个元素出现的次数，并按照从高到低的顺序排序，例如[('f', 3), ('a', 2), ('d', 1), ('g', 1), ('e', 1), ('z', 1)] 实现方法1：首先用Counter计数，然后用sorted排序。 co...

Python 在一段文章中市容正则表达式提取【】或[]所包含内容文字内容出现最多频率的语句和频次

最新发布

04-08

<think>好的，我需要帮助用户用Python和正则表达式提取文本中方括号内的内容，并统计出现频率最高的句子及其频次。首先，我需要理清步骤，确保每一步都正确。首先，用户的需求是提取方括号内的内容。正则表达式应该怎么写呢？方括号在正则中是特殊字符，需要用反斜杠转义，所以模式应该是\[.*?\]。不过要注意贪婪和非贪婪匹配的问题，使用非贪婪模式.*?可以确保匹配到最近的右方括号，避免跨多个括号的情况。例如，文本“这是[例子1]，另一个[例子2]”，使用非贪婪模式可以正确匹配到两个结果，而贪婪模式可能会把整个“[例子1]，另一个[例子2]”作为一个匹配项，这显然不正确。所以正则表达式应该是r'\[(.*?)\]'，这样可以提取括号内的内容，并且用分组捕获里面的文本[^1][^2][^3]。接下来，我需要编写Python代码来实现这个功能。首先导入re模块，用于正则表达式操作。然后读取文本文件，假设用户是从文件中读取的，所以需要用open函数打开文件，并读取内容。或者用户可能直接处理字符串，这里可能需要两种情况处理，但用户问题中没有说明，所以先假设文本已经以字符串形式存在。然后，使用re.findall函数来找到所有匹配的内容。这里要注意，正则表达式中的分组，所以返回的是括号内的内容列表。例如，对于文本中的每个[...]，提取出其中的内容，存入一个列表。接下来是统计频次。可以使用collections模块中的Counter类，它能够方便地统计列表元素的出现次数。将提取到的列表传入Counter，生成一个计数器对象，然后使用most_common()方法获取出现次数最多的项。然后，需要处理结果，输出最高频的句子及其频次。如果有多个句子频次相同，可能需要全部列出，但用户的问题中要求“出现次数最多的句子”，可能只需要最高频的一个，或者多个并列的情况。这里可能需要根据具体情况处理，但示例代码中可以取第一个元素。现在需要考虑代码的各个部分是否存在问题。比如，正则表达式是否正确处理了嵌套方括号的情况？如果文本中有嵌套的方括号，比如“[外层[内层]内容]”，这时正则表达式会匹配到“外层[内层”吗？因为非贪婪匹配会匹配到第一个右方括号。所以这种情况下，嵌套的方括号会导致匹配不正确。但用户的问题中没有提到嵌套的情况，可能不需要处理这种情况，或者需要用户注意文本中是否有嵌套。因此，在代码中可能需要添加注释说明这一点。另外，转义字符的问题，在Python中字符串中的反斜杠需要转义，所以在正则表达式中应该写成r'\[(.*?)\]'，使用原始字符串避免转义错误[^2]。现在编写代码的大致步骤是： 1. 导入必要的模块：re和collections.Counter。 2. 读取文本内容，假设文本存储在变量text中。 3. 使用正则表达式提取所有方括号内的内容，存入列表。 4. 使用Counter统计频次，并获取最高频的项。 5. 输出结果。可能的示例代码： import re from collections import Counter text = "这里是示例文本[句子1]，另一个例子[句子2]，再次出现[句子1]。" matches = re.findall(r'\[(.*?)\]', text) counter = Counter(matches) most_common = counter.most_common(1) print("出现次数最多的句子:", most_common[0][0]) print("频次:", most_common[0][1]) 测试这个代码，如果text中有多个匹配项，是否正确统计。例如，上述示例中“句子1”出现两次，“句子2”出现一次，结果应该正确输出“句子1”和频次2。接下来需要处理用户可能的其他需求，比如如何处理多个最高频的情况，或者没有匹配项的情况。例如，如果文本中没有方括号内容，matches列表为空，此时调用most_common会导致错误。因此，代码中需要添加异常处理，或者检查列表是否为空。此外，用户可能需要将结果按频次排序输出，但问题中只需要最高频的，所以示例代码中使用most_common(1)即可。现在，检查是否有遗漏的步骤或错误。例如，正则表达式是否正确，是否处理了转义，是否考虑了大小写等。用户的问题中没有提到大小写是否敏感，所以默认是区分大小写的，如果有需要，可以在正则表达式中添加标志，比如re.IGNORECASE，但这里可能不需要。总结步骤： - 使用正则表达式提取方括号内容。 - 统计频次并找到最高频的句子。 - 处理可能的异常情况，如无匹配项。最后，生成相关问题，确保符合用户的要求，问题应围绕正则表达式使用、统计方法优化、处理特殊情况等。</think>### 分步解决方案 1. **使用正则表达式提取方括号内容** 正则表达式模式为 `r'\[(.*?)\]'`，其中： - `\[` 和 `\]` 匹配字面量的方括号，需要转义 - `.*?` 表示非贪婪匹配，防止跨括号匹配 ```python import re text = "示例文本[你好]，测试内容[Python正则表达式]，重复项[你好]" matches = re.findall(r'\[(.*?)\]', text) # 输出：['你好', 'Python正则表达式', '你好'] ``` 2. **统计词频** 使用 `collections.Counter` 统计列表元素的频率： ```python from collections import Counter counter = Counter(matches) ``` 3. **获取最高频结果** 通过 `most_common()` 方法获取结果： ```python if matches: most_common = counter.most_common(1) print(f"最高频句子: {most_common[0][0]}, 频次: {most_common[0][1]}") else: print("未找到方括号内容") ``` ### 完整代码 ```python import re from collections import Counter def extract_and_count(text): # 提取方括号内容 matches = re.findall(r'\[(.*?)\]', text) if not matches: return None # 统计频次 counter = Counter(matches) return counter.most_common(1)[0] # 示例文本 text = "[快速排序]是一种高效算法，[Python]的[快速排序]实现如示例所示。" result = extract_and_count(text) if result: sentence, frequency = result print(f"最高频句子: {sentence}, 频次: {frequency}") else: print("文本中没有方括号内容") ``` ### 关键点说明 - **正则表达式**：`r'\[(.*?)\]'` 确保精准提取嵌套外的方括号内容 - **非贪婪匹配**：`.*?` 避免跨括号匹配错误 - **频次统计**：`Counter` 的哈希表实现时间复杂度为 $O(n)$，效率优于手动统计

按出现频率/出现频次 从高到低排序，Python算法，人工智能常用，不用import第三方库的方法

按出现频率/出现频次从高到低排序，Python算法，人工智能常用，不用import第三方库的方法