汉字统计

本文探讨了汉字在文本中的分布规律,通过统计分析大量文本数据,揭示常见汉字的使用频率,为中文信息处理提供基础参考。同时,介绍了几种常用的汉字统计方法和技术,包括字频统计软件和自然语言处理工具的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


题目描述
统计给定文本文件中汉字的个数。
 
输入描述
每组测试数据包含一段文本。
 
输出描述
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。 [提示:]从汉字机内码的特点考虑~
 
输入样例
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
 
输出样例
14
 

这类简单问题,不多说,还记得我们的口号是什么吗?暴力,暴力,暴力解决

//暴力可以直接解决的
#include <stdio.h>
#include <string.h>

void hw(char a[10000])    //直接用一个子函数解决战斗
{
 int sum=0;
 int l=strlen(a);    //计算长度
 for(int i=0;i<l;i++)   //循环判断
 {
  if(a[i]<0||a[i]>126)  //ascll码不在1-126之内的直接++
  sum++;
}
 printf("%d\n",sum/2);      //因为一个汉字是由两个字节来储存的,因此除以2
}
int main()
{
 char a[10000];     //老朽怕麻烦,直接定义一个非常大的储存空间,
 gets(a);      /*因为输入的数据中包含空格,因此用scanf("%s",&a);这个语句的话就会不包含空格,
 因此使用gets(a);语句,表示将输入的数据全部储存在字符数组a中,回车结束*/
 hw(a);       //调用函数
 return 0;
}
/*问题很简单,因此有很多的方法解决,我的只是一种,不一定是简单的,但是一定是可以看的懂的,如果可以的话加一个关注,
随便评论一下都是给我的赞同,有好方法也可以评论回复我,谢谢,加个关注吧 */

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值