192. 统计词频

最新推荐文章于 2025-12-16 14:17:05 发布

原创

最新推荐文章于 2025-12-16 14:17:05 发布 · 1.3k 阅读

38 ·

CC 4.0 BY-SA版权

文章标签：

#开发语言 #算法 #leetcode #bash

使用 Bash 脚本统计文本单词频率（含一行命令解决方案）

在日常的 Linux/Unix 使用中，我们常常需要快速处理和统计文本中的数据。本篇博客将介绍如何使用 Bash 工具链来统计一个文本文件中各个单词出现的频率，并按出现次数进行排序。我们将详细分析题目要求，介绍不同的解题方法，并进行分析和比较。

题目描述

给定一个名为 words.txt 的文本文件，要求统计文件中每个单词出现的频率，并按照出现频率从高到低输出。具体要求如下：

文件中只包含小写字母和空格 ' '。
每个单词只由小写字母组成。
单词之间由一个或多个空格字符分隔。
输出格式为：单词和频率，用空格分隔。
不必处理频率相同单词的排序问题（即频率相同，顺序不限）。

示例：

假设 words.txt 内容如下：

the day is sunny the the
the sunny is is

输出应为：

the 4
is 3
sunny 2
day 1

解题分析

要完成这个统计任务，基本步骤可以拆解为：

分词处理：将文本按

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Joyner2018

关注关注

56
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【中等】力扣算法题解析LeetCode192：统计词频

ylumwd的博客

07-30

354

Bash脚本统计单词频率：通过管道将文本分割为单词行，排序后使用uniq统计词频，再按频率降序排序并调整输出格式。核心命令：tr -s ' ' '\n' | sort | uniq -c | sort -nr | awk '{print $2,$1}'，高效处理流数据，输出单词及其出现次数。

192.统计词频

zrh_优快云的博客

10-29

313

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。为了简单起见，你可以假设： words.txt只包括小写字母和 ' ' 。每个单词只由小写字母组成。单词间由一个或多个空格字符分隔。示例: 假设 words.txt 内容如下： the day is sunny the the the sunny is is 你的脚本应当输出（以词频降序排...

参与评论您还未登录，请先登录后发表或查看评论

【坚持每日一题7.17】192. 统计词频

kangbin825的专栏

07-17

232

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。为了简单起见，你可以假设： words.txt只包括小写字母和 ’ ’ 。每个单词只由小写字母组成。单词间由一个或多个空格字符分隔。示例: 假设 words.txt 内容如下： the day is sunny the the the sunny is is 你的脚本应当输出（以词频降序排列）： the 4 is 3 sunny 2 day 1 说明: 不要担心词频相同的单词的

leetcode192.统计词频

李白

08-06

349

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。为了简单起见，你可以假设：words.txt只包括小写字母和 ' '。每个单词只由小写字母组成。单词间由一个或多个空格字符分隔。...

leetcode 192. 统计词频

天使之翼

07-04

363

LeetCode Shell 192. 统计词频

Alex

07-15

432

192. 统计词频 Ideas xargs分割字符串 -n 1表示每行输出一个 uniq统计词频需要被统计文本相同单词前后在一起，所以先排序 uniq -c表示同时输出单词出现次数 sort -nr表示把数字当做真正的数字处理 Code cat words.txt | xargs -n 1 | sort | uniq -c | sort -nr | awk '{print $2" "$1}' ...

shell：192. 统计词频和 194. 转置文件

weixin_48403549的博客

08-10

303

Be a good Tester~

LeetCode（Shell）- 192. 统计词频

01-10

503

Leetcode—192. 统计词频【中等】（Shell）

Atticus的博客

10-19

350

运行结果之后我会持续更新，如果喜欢我的文章，请记得一键三连哦，点赞关注收藏，你的每一个赞每一份关注每一次收藏都将是我前进路上的无限动力！！！↖(▔▽▔)↗感谢支持！

Leetcode#192. 统计词频

CongliYin的博客

08-11

553

统计文件中单词出现的个数。思路： tr 把空格全部转换成换行 sed把空行全部过滤掉 sort排序 uniq统计词频 sort 降序 awk 格式输出 cat words.txt | tr " " "\n" | sed -e '/^$/d' | sort | uniq -c | sort -rn | awk '{print $2,$1}'...

algoboy101#note_blog_leetcode#[192]统计词频1

07-25

示例:the day is sunny the the你的脚本应当输出（以词频降序排列）：说明:不要担心词频相同的单词的排序问题，每个单词出现的频率都是唯一的。

Shell例题-192. 统计词频

wnccmyr的博客

10-26

411

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。假设： words.txt只包括小写字母和 ' ' 。每个单词只由小写字母组成。单词间由一个或多个空格字符分隔。示例: 假设 words.txt 内容如下： the day is sunny the the the sunny is is 你的脚本应当输出（以词频降序排列）： the 4 is 3 sunny 2 day 1 说明: 不要担心词频相同的单词的排序问题，每个单词出现的频率..

【开发语言】Rust语言介绍

wendao76的专栏

12-07

1667

Rust是一种系统级编程语言，由Mozilla开发并于2015年发布1.0版本，现由Rust基金会维护。其核心特点是内存安全、高性能和并发友好，通过所有权模型和零成本抽象实现无GC的内存管理。与Go相比，Rust更适用于高性能系统编程，而Go更适合快速开发高并发服务。Rust广泛应用于操作系统、区块链、Web后端等领域，并连续多年被评为最受开发者喜爱的语言。基础语法包括变量、数据类型、所有权等，高级特性涵盖Trait、生命周期、异步编程等。尽管学习曲线陡峭，但Rust在性能敏感领域前景广阔。

智驾空间智能、物理智能、世界模型相关的最新论文和开源算法链接

最新发布

Bonaventure的博客

12-16

777

这些资源涵盖了2025年自动驾驶领域的前沿研究，从空间推理到物理建模和世界模拟，提供了丰富的开源工具和理论框架。建议用户通过链接深入探索论文和代码，以应用于实际项目或进一步研究。如果您需要更详细的解读或特定应用建议，请随时补充信息！

JVM 之垃圾回收算法及其内部实现原理【垃圾回收的核心问题有哪些？分别怎么解决的？可达性分析解决了什么问题？回收算法有哪些？内部怎么实现的？】

人生快意事，读的好书，觅得良友

12-16

743

JVM垃圾回收面临的核心问题有哪些？分别怎么解决的？可达性分析解决了什么问题？回收算法有哪些？内部怎么实现的？根节点枚举、安全点、安全区域、记忆集与卡表、写屏障、并发性可达性分析各自解决了什么问题？怎么协同工作的？ G1中他们是怎么协作的？

二插堆的基本原理以及简单实现

for_ever_love__的博客

12-14

255

二叉堆是一种完全二叉树，它满足堆属性：最大堆：每个节点的值都大于或等于其子节点的值最小堆：每个节点的值都小于或等于其子节点的值。

【光伏风测功率预测】风光储一张网：多场站功率预测与协同调度的算法框架解析

专注AI大模型,软件混淆,授权

12-16

234

摘要：随着新能源渗透率提升，风光储一体化系统从单场站运行转向集群化运营，亟需多场站功率预测与协同调度解决方案。本文提出"数据层-预测层-调度层-运维层"四层架构：通过多源气象融合和站点拓扑构建数据基础；采用GNN+Transformer等图时空模型实现多场站联合预测；基于概率预测(P10/P50/P90)和MPC滚动优化进行储能调度；配套MLOps保障系统稳定性。该方案能降低聚合预测误差15%-30%，减少偏差考核费用20%以上，提升现货交易收益，为风光储基地和虚拟电厂提供可落地的技术路

从0开始学算法——第十五天（滑动窗口练习）

2401_84407045的博客

12-13

1380

学习了今天的基础知识，让我们来做几道题来练练手吧。（题目是别的地方扒来的，参考答案是我自己写的，肯定不是最优解，有更好的方法欢迎评论区交流）

10-29

该代码实现了一个完整的MapReduce词频统计程序，包含Mapper、Reducer和主类配置。程序从HDFS指定路径读取文本文件，对单词进行分割并统计出现次数，结果输出至HDFS另一目录。 # 代码解析 ```java import java.io....