Linux （CentOs）统计文件单词数量

最新推荐文章于 2024-10-22 22:58:58 发布

原创

最新推荐文章于 2024-10-22 22:58:58 发布 · 1.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#linux #centos #运维

本文介绍了如何在Linux（CentOS）系统中利用状态机原理统计文件中的单词数量。通过跟踪字符状态（OUT和IN），在遇到字母时切换状态，从而计算单词总数。

声明：如有侵权，请联系删除。本篇源头是我的一个朋友@Abieai的博客。

1、原理：

状态机初始化状态设置为OUT状态，当识别为字母时就会进入IN状态，中间如果遇到分隔符的话，就会再次变为OUT状态，通过计算状态变换的次数，来计算单词的数量。也就是所有字符=字母+分隔符。根据状态机的OUT和IN状态变换来判断一个文件中的字符数量。

2、实现：

#include <stdio.h>

#define OUT  0	//设置OUT状态
#define IN   1	//设置IN状态

#define INIT  OUT   //初始化状态


int count_word(char *filename){ //文件名

    int status=INIT;//初始化状态
    int word=0;//单词量初始数

    FILE *fp = fopen(filename,"r");//可读权限
    if(fp == NULL)  return -1;

    char c;
    while((c=fgetc(fp))!=EOF){
        if((c<65||c>90)&&(c<97||c>122)){//非字母的
            status=OUT;
        }else if(OUT==status) {
            status=IN;
            word++;
        }
    }
    return word;
}

int main(int argc,char *argv[]){
    if(argc<2)return -1;
    printf("word %d\n",count_word(argv[1]));//输出单词总数

}

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

作家不写作

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

Linux中Centos7目录和文件管理

2301_76960518的博客

06-23

1365

本学期学习了Linux基础知识，从刚刚开始学的如何安装Linux系统，把我折腾了好几回，安装了不下五次的虚拟机，在多次重复安装之后，也对安装Linux系统有了一定的了解，现在对安装系统也轻松简单了许多。在学习系统操作与设置时，在课上也是一脸懵的状态，在课后，询问舍友同学，在他们求助下才勉强完成了作业，现在对这来说也是蛮印象深刻的。最令我印象深刻的有以下几个问题：一是软件安装问题：在Linux上安装软件可能会遇到一些问题，例如依赖关系、版本兼容性等。

CentOS 7基础操作09_Linux查看及检索文件

IT_zhangsan

06-04

2056

对于一个文本格式的配置文件，可以利用不同的查看方式来获知文件内容，如直接显示整个文件内容.分页查看文件内容，或者只查看文件开头或末尾的部分内容。在Linux操作系统中，分别由不同的命令来实现这些操作.

参与评论您还未登录，请先登录后发表或查看评论

3. Linux下实现统计文件单词个数和出现次数

Ricardo2的博客

05-19

2131

本文介绍的是在Linux下实现统计文件单词个数和出现次数，以及实践过程中遇到的gcc编译器不匹配问题

linux统计单词数

weixin_34132768的博客

07-07

634

sort +awk+uniq 统计文件中出现次数最多的前10个单词实例cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100.csharpcode, .csharpcode pre { font-size: small; color: black; font-family: co...

第一个LINUX驱动程序：统计单词个数

01-09

第1步：建立驱动骨架（装载和卸载Linux驱动）　　使用module_init和module_exit宏指定　　第2步：注册和注销设备文件　　Linux驱动需要一个设备文件，否则应用程序将无法与驱动程序交互。这些都在第一步初始化工作的函数中完成。可以使用misc_register和misc_deregister函数创建和移除设备文件。　　第3步：指定与驱动相关的信息　　可以通过modinfo命令获取这些信息　　第4步：指定回调函数　　第5步：编写业务逻辑　　第6步：编写Makefile文件　　Linux内核源代码的编译规则是通过Makefile文件定义的。

Linux - wc统计文件行数、单词数或字节数

zzbjut

06-14

9947

Linux中wc的详细使用。

linux统计文件单词数,利用awk计算文件的单词数量及排序

weixin_39517241的博客

04-28

500

[root@oldboy awk]# awk 'BEGIN{RS="(:|\n)"} {print $0}' /etc/passwd |sort|uniq -c|sort -r26 x20 /sbin/nologin6 064 /sbin4 /3 /bin/bash2 uucp2 sync2 shutdown2 root2 operator2 mail2 lp2 halt2 gopher2 gam...

【天枢系列 01】Linux行数统计：命令对决，谁才是王者？

weixin_40736233的博客

02-16

1871

通过行数统计命令（如wc），可以揭示数据背后的信息，帮助我们更清晰地理解文本文件或者数据流的内容。

调用MapReduce对文件中各个单词出现次数进行统计

weixin_49230161的博客

06-09

2060

调用MapReduce对文件中各个单词出现次数进行统计一、安装Linux二、准备工作2.1 创建Hadoop账户2.2 更新apt2.3 安装vim2.4 配置SSH三、安装Java3.1 安装JDK3.2 设置JAVA环境变量四、安装Hadoop4.1 配置环境变量和进行伪分布式操作4.2 格式化 NameNode4.3 开启NameNode和DataNode守护进程4.4 校验安装五、调用MapReduce执行WordCount对单词进行计数5.1 准备工作（确保安装好eclipse和下载好hadoop

Centos 统计文件夹下文件和文件夹的个数

weixin_33966365的博客

06-28

312

运营管理中经常会碰到关于文件统计的需求，近期在做系统迁移，正好做个备忘。关键词：d : directory- : 一般文件以下命令在需要统计的目录下进行，如：# cd 目标文件夹统计某文件夹下文件的个数# ls -l |grep "^-"|wc -l统计某文件夹下目录的个数# ls -l |grep "^ｄ"|wc -l统计文件夹下文件的个数，包括子文件夹里的# ls ...

多线程统计多个文件的单词数目

04-08

这个文件包含三个文件夹，有自己写的两个版本以及一个网上的版本，操作步骤详尽，注释清晰

linux-统计一个文件中出现的单词数

weixin_30892763的博客

08-26

1403

#!/bin/bash if [ $# -ne 1 ] then echo "Usage: $0 filename"; exit -1 fi filename=$1 egrep -o "\b[[:alpha:]]+\b" $filename | \ awk '{ count[$0]++ } END{ printf("%-14s%s\n", "word", "count")...

Linux脚本练习之script067-统计每个单词出现的个数

二木成林

07-18

1847

写一个 bash脚本以统计一个文本文件 `nowcoder.txt` 中每个单词出现的个数。

linux统计文件单词数,Linux怎么统计文本的的行数/单词数和字符数?

weixin_42324688的博客

04-28

3497

Linux系统中想要统计文本的行数、单词和字符数量，该怎么统计呢？我们可以使用SecureCRT来统计，下面我们就来看看详细的教程。1、启动Linux系统，用SecureCRT(或者其他的ssh工具，如xshell等)连上Linux系统。也可以在Linux操作系统上直接操作，在Linux系统上打开终端。2、在终端输入wc，看Linux系统上是否安装过wc命令(若没有安装wc名，请百度wc怎么安装，...

Linux C编程：统计文件单词数量&统计每个单词出现的次数

qq_75158598的博客

10-22

1213

这是零声学院Linux入门环境编程的第二个项目，原本是统计文件单词数量作为例题，统计每个单词出现的次数作为课后作业。其中统计文件单词数量是用有限状态机来实现的，原理比较简单，且我认为源码存在一定缺陷，因此不介绍状态机的方法。下面我直接推倒重来，将两个问题合并起来解决。int count;MAX_WORDS：定义了最多可以处理 1000 个不同的单词。：单词的最大长度为 100 个字符。WordCount结构体用来保存每个单词及其出现的次数。

linux统计文件单词数,linux-统计一个文件中出现的单词数

weixin_35509395的博客

04-28

898

R语言解读一元线性回归模型转载自:http://blog.fens.me/r-linear-regression/ 前言在我们的日常生活中,存在大量的具有相关性的事件,比如大气压和海拔高度,海拔越高大气压强越小:人的身高和体 ...异常之Tomcat7&period;0服务器无法发布项目今天突然就不能发布tomcat 7.0服务器了,并弹出对话框,报出如下错误: Cannot acqui...

编写Linux驱动八步骤

weixin_34186950的博客

07-11

164

一、建立Linux驱动框架（装载、卸载Linux驱动）Linux内核在使用驱动时首先要装载驱动，在装载过程中进行一些初始化动作（建立设备文件、分配内存等），在驱动程序中需提供相应函数来处理驱动初始化工作，该函数须使用module_init宏指定；Linux系统在退出是需卸载Linux驱动，卸载过程中进行一些退出工作（删除设备文件、释放内存等），在驱动程序中需提供相应函...

linux查看单词个数,Linux怎么统计文本的的行数/单词数和字符数?

weixin_35344136的博客

05-15

5554

Linux怎么统计文本的的行数/单词数和字符数?Linux系统中想要统计文本的行数、单词和字符数量，该怎么统计呢？我们可以使用SecureCRT来统计，下面我们就来看看详细的教程。1、启动Linux系统，用SecureCRT(或者其他的ssh工具，如xshell等)连上Linux系统。也可以在Linux操作系统上直接操作，在Linux系统上打开终端。2、在终端输入wc，看Linux系统上是否安装过...

linux 查看当前用户家目录下所有的文件并将结果存入test.txt。请使用cat、grep、管道符、wc命令组合，进行统计：统计文件中带有bash关键字的有几行统计文件中带有bash关键字的结果中有多少个单词 2）请使用find命令找出：系统中带有centos的文件；请使用find命令找出：/usr 目录内大于100M的文件

最新发布

04-01

Linux （CentOs） 统计文件单词数量

1、原理：

2、实现：

Linux （CentOs）统计文件单词数量