词频统计程序

这是一个用于统计英文文本单词频率的程序,可以导入任意文本文件,将单词转换为小写并去除特殊字符,使用单链表统计词频,并通过冒泡排序输出所有单词及其频率。程序还提供功能将结果写入文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

做一个词频统计程序,该程序具有以下功能
(1)可导入任意英文文本文件
(2)统计该英文文件中单词数和各单词出现的频率(次数),并能将单词按字典顺序输出。
(3)将单词及频率写入文件。
本程序思路大概为:
1.打开需要的txt文件,把其中的文本内容读入程序流中
2 .将文本内容中的大写字母转化为小写,去除,。、?等特殊字符
3. 用单链表对词频进行统计
4. 用冒泡法对统计结果进行排序
5.打印输出全部词频或者频率最高的单词和其出现次数

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define MAX 5000

/*定义结构体*/
struct Word
{
	int num;  //定义单词频数
	char str[20];
}
word[MAX];

/*读取文章*/
void  read(char *article,int *total,char *ch)
{
	int i;
    FILE*fp;
 
{
	char FileName[20];
	printf("请输入文件名(例如//123.txt): "); 
	scanf("%s",FileName);
	fp=fopen(FileName,"r");  //打开需要的文件
	if(!fp)
	{
		printf("\n打开文件失败!");
		exit(0);
	}
}


//获取文章及总字符数
(*ch)=fgetc(fp);  //先判断文章是否为空。
if(*ch!=NULL)
{
	article[0]=(*ch);
	for(i=1;!feof(fp);i++)  //依次读取文章
		article[i]=fgetc(fp);
	article[i]='\0';
	(*total)=strlen(article);
}
fclose(fp);
}
 

/*显示文章*/
void show(char *article,int *total,char *ch)
{
   printf("%s",article);
   printf("\n");
}

/*按字典顺序
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值