哈夫曼树对文件进行译码

  1 #include "stdio.h"
  2 const int maxlen = 1000;
  3 #define infinity 65535
  4 
  5 struct encode{
  6     char  Data[maxlen];//存储编码(字符类型)
  7     int count;//编码的位数
  8 };
  9 struct bnode
 10 {
 11     int data;//数据
 12     char ch;//字符
 13     bnode *lchild,*rchild;//左孩子,右孩子结点
 14     encode code;//存储编码信息
 15     bool flags;//使用标志
 16 };
 17 
 18 struct FileChar{
 19     char ch;//字符
 20     int count;//字符在文章出现的次数
 21 };
 22 
 23 bnode *tree[maxlen];
 24 FileChar CharNum[maxlen];//存放字符以及字符出现的次数
 25 int num_char= 0;//不同字符的总数
 26 
 27 /*
 28 * int A[]:存放字符的频度
 29 *int N:字符的个
 30 *bnode *tree[maxlen]//树
 31 */
 32 void initialization(int N,bnode *tree[maxlen])//初始化
 33 {
 34     int i;
 35     for(i=0;i<N;i++)
 36     {
 37         tree[i] = new bnode;
 38         tree[i]->data = CharNum[i].count;//结点的值
 39         tree[i]->ch = CharNum[i].ch;//结点的字符
 40         tree[i]->flags = true;//标识未使用
 41         tree[i]->code.count = 0;//编码位数为0
 42         tree[i]->lchild = NULL;//左子树为空
 43         tree[i]->rchild = NULL;//右子树为空
 44     }
 45 }
 46 
 47 void merge(int &n,bnode *tree[maxlen])//寻找当前根结点值最小的两个子树将其合并
 48 {
 49     int i,num1,num2,min1,min2;
 50     min1 = infinity;
 51     min2 = infinity;
 52     for(i=0;i<n;i++)//寻找当前值最小的根节点
 53     {
 54         if((tree[i]->data<min1)&&tree[i]->flags)
 55         {
 56             min1 = tree[i]->data;
 57             num1 = i;
 58         }
 59     }
 60     tree[num1]->flags = false;//设置标识已使用过
 61 
 62     for(i=0;i<n;i++)//寻找当前值最小的根节点
 63     {
 64         if((tree[i]->data<min2)&&tree[i]->flags)
 65         {
 66             min2 = tree[i]->data;
 67             num2 = i;
 68         }
 69     }
 70     tree[num2]->flags = false;//设置标识已使用过
 71     //将两个子树合并
 72     tree[n] = new bnode;
 73     tree[n]->data = tree[num1]->data + tree[num2]->data;
 74     tree[n]->flags = true;
 75     tree[n]->code.count = 0;//编码位数为0
 76     tree[n]->lchild = tree[num1];
 77     tree[n]->rchild = tree[num2];
 78     n++;
 79 }
 80 
 81 void Huffmantree(int &n,bnode *tree[maxlen])//构造哈夫曼树
 82 {
 83     int i,num;
 84     bool flags = true;//标识
 85     while(flags)
 86     {
 87         num = 0;//计数
 88         for(i=0;i<n;i++)//统计未使用结点数
 89         {
 90             if(tree[i]->flags)
 91             {
 92                 num++;
 93             }
 94         }
 95         if(num>=2)
 96         {
 97             merge(n,tree);//合并当前根结点值最小的两棵子树
 98         }else{
 99             flags = false;//哈夫曼树构造完成标识
100         }
101     }
102 }
103 
104 void HFTree(bnode *Tree)//中序输出哈夫曼树
105 {
106     if(Tree)
107     {
108         HFTree(Tree->lchild);
109         printf(" %d",Tree->data);
110         HFTree(Tree->rchild);
111     }
112 }
113 
114 void Encode(bnode *Tree)//每个结点进行编码
115 {
116     int i,count;
117     if(Tree)
118     {
119         if(Tree->lchild)//左子树根结点添加0
120         {
121             count = Tree->code.count;
122             for(i=0;i<count;i++)//父节点的编码添加到自己身上
123             {
124                 Tree->lchild->code.Data[i] = Tree->code.Data[i];
125                 Tree->lchild->code.count++;
126             }
127             
128             Tree->lchild->code.Data[count] = '0';//再添加0
129             Tree->lchild->code.count++;
130         }
131         if(Tree->rchild)//右子树根结点添加1
132         {
133             count = Tree->code.count;
134             for(i=0;i<count;i++)//父节点的编码添加到自己身上
135             {
136                 Tree->rchild->code.Data[i] = Tree->code.Data[i];
137                 Tree->rchild->code.count++;
138             }
139             Tree->rchild->code.Data[count] = '1';//再添加1
140             Tree->rchild->code.count++;
141         }
142         Encode(Tree->lchild);//左子树继续
143         Encode(Tree->rchild);//右子树继续
144     }
145     
146 }
147 
148 //进行统计各个字符出现的次数
149 void analyse(FILE *fp)
150 { 
151     int i;
152     bool flags;//标志,是否为新的字符
153     char ch;//字符
154  
155     while((ch = fgetc(fp))!=EOF)//从文件内读取字符
156     {     
157         flags = true;
158         for(i=0;i<num_char;i++)//字符进行处理
159         {
160             if(ch==CharNum[i].ch)//字符已经存在,次数+1
161             {
162                 CharNum[i].count++; //字符出现次数+1
163                 flags = false;
164                 break;
165             }
166         }
167         if(flags)//此字符目前还不存在
168         {
169             CharNum[num_char].count = 1;//字符出现次数+为
170             CharNum[num_char].ch = ch;//新字符保存
171             num_char++;//不同字符总次数+!
172         }
173     }
174 }
175 
176 
177  void Save_Code()//保存编码
178  {
179      int i,j,k;
180      FILE *fp;
181      if((fp=fopen("D:/code.txt","w+"))==NULL)
182      {
183         printf("文件不存在\n");
184         
185      }else{
186         fprintf(fp,"%s","字符\t编码\n");
187         printf("[编码结果显示]\n字符\t编码\n");
188         //每个字符及其编码包存到文件中
189         for(i=0;i<num_char;i++)
190         {
191             for(j=0;j<num_char;j++)
192             {
193                 if(CharNum[i].ch==tree[j]->ch)//找到字符
194                 {
195                     fprintf(fp,"%c\t",CharNum[i].ch);//字符存入文件
196                     printf("%c\t",CharNum[i].ch);
197                     for(k=0;k<tree[j]->code.count;k++)
198                     {
199                         fprintf(fp,"%c",tree[j]->code.Data[k]);//字符编码存入文件
200                         printf("%c",tree[j]->code.Data[k]);
201                     }
202                     fprintf(fp,"%c",'\n');//换行符添加到文件中
203                     printf("\n");
204                 }
205             }
206         }
207        fclose(fp);
208     }
209  }
210 
211  void  translate(char file[])//译码
212  {
213     FILE *fp,*fout;
214     char ch;
215     int i,k;
216     int Line =0;//标识
217     if((fp=fopen(file,"r+"))==NULL)
218     {
219         printf("文件操作出错!\n"); 
220 
221     }else{
222         if((fout=fopen("D:/decode.txt","w+"))==NULL)
223         {
224             printf("文件不存在\n");
225         
226         }else{
227             printf("[译码结果显示]\n");
228             while((ch = fgetc(fp))!=EOF)//从文件内读取字符
229             {   
230                 Line++;//字符数+1
231                 for(i=0;i<num_char;i++)
232                 {
233                     if(ch==tree[i]->ch)//找到tree中对应的字符
234                     {
235                         for(k=0;k<tree[i]->code.count;k++)
236                         {
237                             fprintf(fout,"%c",tree[i]->code.Data[k]);//字符编码存入文件
238                             printf("%c",tree[i]->code.Data[k]);
239                         }
240                         fprintf(fout,"%c",' ');//换行符添加到文件中
241                         printf(" ");
242                     }
243                 }
244                 if(Line%10==0)
245                 {
246                         fprintf(fout,"%c",'\n');//每个10个换行
247                         printf("\n");
248                 }
249             }
250         }
251         printf("\n");
252         fclose(fout);
253     }
254  }
255 
256 int main()
257 {
258     int n;
259     FILE *fp;
260     printf("输入文件路径:");
261     char file[30];
262     scanf("%s",&file);//输入文件路径
263     if((fp=fopen(file,"r+"))==NULL)
264     {
265         printf("文件操作出错!\n"); 
266 
267     }else{
268         analyse(fp);   
269     }
270 
271     n = num_char;
272     initialization(n,tree);//左右子树初始化
273     Huffmantree(n,tree);//构造哈夫曼树
274     printf("[哈夫曼树中序输出\:");
275     HFTree(tree[n-1]);
276     printf("\n");
277 
278     Encode(tree[n-1]);
279     Save_Code();
280     printf("[编码已经保存!]\n");
281     translate(file);
282     printf("[译码已经保存!]\n");
283     return 0;
284 }

 

转载于:https://www.cnblogs.com/minmsy/p/5082387.html

[ 问题描述 ] 利用哈夫曼编码进行信息通讯可以大大提高信道利用率, 缩短信息传输时间,降低传输成本。但是, 这要求在发送端通过一个编码系统对待传数据预先编码; 在接收端将传来的数据进行译码( 复原 )。对于双工信道( 即可以双向传输信息的信道 ), 每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼码的编译码系统。 [ 基本要求 ] 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小 n,及 n 个字符和 n 个权值,建立哈夫曼, 并将它存于文件 hfmtree 中。 (2) C:编码(Coding)。利用已建好的哈夫曼(如不在内存, 则从文件 hfmtree 中读入), 对文件 tobetrans 中的正文进行编码, 然后将结果存入 codefile 中。 (3) D:译码(Decoding)。利用已建好的哈夫曼文件 codefile 中的代码进行译码, 结果存入文件 textfile 中。 (4) P:印代码文件(Print)。将文件 codefile 以紧凑格式显示在终端上, 每行 50 个代码。同时将此字符形式的编码文件写入文件 codeprint 中。 (5) T:印哈夫曼(Tree print)。将已在内存中的哈夫曼以直观的方式( 或凹入表行式 )显示在终端上, 同时将此字符形式的哈夫曼写入文件 treeprint 中。 [ 测试数据 ] (1)利用教科书 6-2 中的数据调试程序。 (2)用下表中给出的字符集和频度的实际统计数据建立哈夫曼, 并实现以下报 文的编码和译码: "THIS PROGRAM IS MY FAVORITE". 字符 A B C D E F G H I J 频度 186 64 13 22 32 103 21 15 47 57 1 字符 K L M N O P Q R S T U 频度 5 32 20 57 63 15 1 48 51 80 23 字符 V W X Y Z 频度 8 18 1 16 1 [ 实现提示 ] (1) 文件 codefile 的基类型可以设为子界型 bit=0..1。 (2) 用户界面可以设计为"菜单"方式: 显示上述功能符号, 再加上"E",表示结束运行 End, 请用户键入一个选择功能符。此功能执行完毕后再显示此菜单, 直至某次用户选择了 "E"为止。 (3) 在程序的一次执行过程中, 第一次执行 I,D 或 C 命令之后, 哈符曼已经在内存了, 不必再读入。每次执行中不一定执行 I 命令, 因为文件 hfmtree 可能早己建好。 [ 选作内容 ] (1) 上述 codefile 的基类型实际上占用了存放一个整数的空间, 只起到示意或模拟的作用。现使 codefile 的基类型 package=integer, 把哈夫曼码紧缩到一个整型变量中去, 最大限度地利用码点存储能力, 试改写你的系统。 (2) 修改你的系统, 实现对你的系统的源程序的编码和译码。( 主要是将行尾符编/译码问题 ) (3) 实现各个转换操作的源/目文件, 均由用户在选择此操作时指定。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值