LeetCode192——统计词频

最新推荐文章于 2022-07-11 23:52:57 发布

清風逐尘乀

最新推荐文章于 2022-07-11 23:52:57 发布

阅读量779

点赞数

CC 4.0 BY-SA版权

分类专栏： LeetCode题解文章标签： LeetCode 统计词频 Linux

本文链接：https://blog.youkuaiyun.com/qq_41231926/article/details/86620386

263 篇文章

订阅专栏

博客介绍了如何使用Linux命令行工具解决LeetCode192问题，提供了两种思路：一是结合cat、tr、sort、uniq和awk命令，二是仅用awk和sort命令。内容包括每种思路的详细步骤和Bash脚本，适合熟悉Linux指令的读者学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目描述：

知识点：Linux常用指令

cat命令：用于连接文件并打印到标准输出设备上。

tr命令：用于转换或删除文件中的字符，其中的-s选项表示--squeeze-repeats，即缩减连续重复的字符成指定的单个字符。

sort命令：用于将文本文件内容加以排序，其中-r参数表示以相反的顺序来排序，本题中即降序。

uniq命令：用于删除文件中的重复行，其中-c选项表示在输出行前面加上每行在输入文件中出现的次数。

awk命令：AWK是一种处理文本文件的语言，是一个强大的文本分析工具。下述脚本中awk命令的用法表示每行按空格或TAB分割，输出文本中的第2、1项。

Bash脚本：

cat words.txt | tr -s ' ' '\n' | sort | uniq -c | sort -r | awk '{ print $2, $1 }'

LeetCode解题报告：

NF：是awk命令的内建变量，代表一条记录的字段的数目。

END：是awk命令的关键字，END{这里面放的是处理完所有的行后要执行的语句}。awk命令还有一个关键字BEGIN，BEGIN{这里面放的是执行前的语句}。而没有关键字时，{这里面放的是处理每一行时要执行的语句}。

sort命令的-n参数表示依照数值的大小排序，-r参数表示以相反的顺序来排序，-k参数选择以哪个区间来进行排序。

Bash脚本：

awk '{ for (i = 1; i <= NF; i++) { D[$i]++; } } END { for (i in D) { print i, D[i] } }' words.txt | sort -nr -k 2

LeetCode解题报告：