在当前目录中存在文件名为"case1.in"(其中case后为数字1,不是字母l,写错提交后会判错)的文本文件,其内容为一篇英文文章(以EOF作为结束标志)。现要求读取该文本文件内容,统计文章中每个单词出现的次数,并输出出现次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出,不足5个单词时,按序输出全部单词)。程序中注意如下细节:
(1) 空格、标点符号与回车符起到分隔单词的作用。
(2) 文章一行的末尾可能有连字符,出现连字符时,该行最末的字符串与下行最先出现的字符串构一个单词;
(3) 名词缩写算一个单词;
(4) 数字不算单词;
(5) 单词不区分大小写;
(6) 输出时单词全使用小写;
#include “stdio.h”
#include “math.h”
#include “string.h”
#include “stdlib.h”
_______________________
main()
{
_______________________
}
整体思路:
①声明一个二维数组作为单词表,将文件中的字符一个一个读出来,按照条件组成单词,每个单词储存在二维数组的一行中,每读取一个单词就按字典顺序进行排序,读完之后的单词表就是按字典顺序排好的,但还有重复
②定义一个结构体变量,用结构体变量储存单词并记录其出现的次数
③在不打乱单词表顺序的前提下按照次数进行排序,排出满足条件的前五个进行输出
代码实现:
#include "stdio.h"
#include "math.h"
#include "string.h"
#include "stdlib.h"
struct infomation //用结构体变量记录单词及其出现的次数
{
char eng[21];
int quantity;
};
void sort(char a[][21], char current[21], int row) //用插入排序把已有的单词排序
{
//注:因为 current实际上是存有单词的最后一行,所以下面的 a[row+1] 就是 current
int i = 0, j, k, m=0;
if(strcmp(current , a[i]) <= 0) //如果 current里的单词排在第一位
{
//把在数组中所有单词都往后移一行
for(j = row ; j >= 0; j--)
{
strcpy(a[j+1] , a[j]) ;
}
strcpy(a[0] , a[row+1]) ; //再把 current里的单词放到 a[0] 里
while((*a[row+1]+m) != 0 && m < 20) //把 current的内容清空,以免影响之后的单词读取
{
//其实这里可以用 memset() 函数,但一开始没想到
*(a[row+1]+m) = 0;