汉字统计

最新推荐文章于 2021-01-26 10:27:13 发布

gznu_sprint

最新推荐文章于 2021-01-26 10:27:13 发布

阅读量980

点赞数 2

CC 4.0 BY-SA版权

分类专栏： C/C++语言基础题目

本文链接：https://blog.youkuaiyun.com/qq_42042708/article/details/80043240

C/C++语言基础题目专栏收录该内容

7 篇文章

订阅专栏

本文探讨了汉字在文本中的分布规律，通过统计分析大量文本数据，揭示常见汉字的使用频率，为中文信息处理提供基础参考。同时，介绍了几种常用的汉字统计方法和技术，包括字频统计软件和自然语言处理工具的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目描述

统计给定文本文件中汉字的个数。

输入描述

每组测试数据包含一段文本。

输出描述

对于每一段文本，输出其中的汉字的个数，每个测试实例的输出占一行。

[提示:]从汉字机内码的特点考虑~

输入样例

WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!

输出样例

14

这类简单问题，不多说，还记得我们的口号是什么吗？暴力，暴力，暴力解决

//暴力可以直接解决的
#include <stdio.h>
#include <string.h>

void hw(char a[10000])    //直接用一个子函数解决战斗
{
int sum=0;
int l=strlen(a);    //计算长度
for(int i=0;i<l;i++)   //循环判断
{
  if(a[i]<0||a[i]>126)  //ascll码不在1-126之内的直接++
  sum++;
}
printf("%d\n",sum/2);      //因为一个汉字是由两个字节来储存的，因此除以2
}
int main()
{
char a[10000];     //老朽怕麻烦，直接定义一个非常大的储存空间，
gets(a);      /*因为输入的数据中包含空格，因此用scanf("%s",&a);这个语句的话就会不包含空格，
因此使用gets(a);语句，表示将输入的数据全部储存在字符数组a中，回车结束*/
hw(a);       //调用函数
return 0;
}

/*问题很简单，因此有很多的方法解决，我的只是一种，不一定是简单的，但是一定是可以看的懂的，如果可以的话加一个关注，
随便评论一下都是给我的赞同，有好方法也可以评论回复我，谢谢，加个关注吧 */