声明:如有侵权,请联系删除。本篇源头是我的一个朋友@Abieai的博客。
1、原理:
状态机初始化状态设置为OUT状态,当识别为字母时就会进入IN状态,中间如果遇到分隔符的话,就会再次变为OUT状态,通过计算状态变换的次数,来计算单词的数量。也就是所有字符=字母+分隔符。根据状态机的OUT和IN状态变换来判断一个文件中的字符数量。
2、实现:
#include <stdio.h>
#define OUT 0 //设置OUT状态
#define IN 1 //设置IN状态
#define INIT OUT //初始化状态
int count_word(char *filename){ //文件名
int status=INIT;//初始化状态
int word=0;//单词量初始数
FILE *fp = fopen(filename,"r");//可读权限
if(fp == NULL) return -1;
char c;
while((c=fgetc(fp))!=EOF){
if((c<65||c>90)&&(c<97||c>122)){//非字母的
status=OUT;
}else if(OUT==status) {
status=IN;
word++;
}
}
return word;
}
int main(int argc,char *argv[]){
if(argc<2)return -1;
printf("word %d\n",count_word(argv[1]));//输出单词总数
}


本文介绍了如何在Linux(CentOS)系统中利用状态机原理统计文件中的单词数量。通过跟踪字符状态(OUT和IN),在遇到字母时切换状态,从而计算单词总数。
最低0.47元/天 解锁文章
1365

被折叠的 条评论
为什么被折叠?



