LeetCode192——统计词频

博客介绍了如何使用Linux命令行工具解决LeetCode192问题,提供了两种思路:一是结合cat、tr、sort、uniq和awk命令,二是仅用awk和sort命令。内容包括每种思路的详细步骤和Bash脚本,适合熟悉Linux指令的读者学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我的LeetCode代码仓:https://github.com/617076674/LeetCode

原题链接:https://leetcode-cn.com/problems/word-frequency/description/

题目描述:

知识点:Linux常用指令

思路一:cat+tr+sort+uniq+sort+awk

cat命令:用于连接文件并打印到标准输出设备上。

tr命令:用于转换或删除文件中的字符,其中的-s选项表示--squeeze-repeats,即缩减连续重复的字符成指定的单个字符。

sort命令:用于将文本文件内容加以排序,其中-r参数表示以相反的顺序来排序,本题中即降序。

uniq命令:用于删除文件中的重复行,其中-c选项表示在输出行前面加上每行在输入文件中出现的次数。

awk命令:AWK是一种处理文本文件的语言,是一个强大的文本分析工具。下述脚本中awk命令的用法表示每行按空格或TAB分割,输出文本中的第2、1项。

Bash脚本:

cat words.txt | tr -s ' ' '\n' | sort | uniq -c | sort -r | awk '{ print $2, $1 }'

LeetCode解题报告:

思路二:awk+sort

NF:是awk命令的内建变量,代表一条记录的字段的数目。

END:是awk命令的关键字,END{这里面放的是处理完所有的行后要执行的语句}。awk命令还有一个关键字BEGIN,BEGIN{这里面放的是执行前的语句}。而没有关键字时,{这里面放的是处理每一行时要执行的语句}。

sort命令的-n参数表示依照数值的大小排序,-r参数表示以相反的顺序来排序,-k参数选择以哪个区间来进行排序。

Bash脚本:

awk '{ for (i = 1; i <= NF; i++) { D[$i]++; } } END { for (i in D) { print i, D[i] } }' words.txt | sort -nr -k 2

LeetCode解题报告:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值