哈弗曼树讲解---c语言实现

哈夫曼树

哈弗曼树定义

赫夫曼树:又称为最优二叉树,它是一类带权路径长度最短的二叉树。
路径:从一个结点到另一个结点之间的分支序列构成两个结点 之间的路径。
路径长度:连接两结点的路径上的分支数。
树的路径长度:从根结点到各结点的路径长度之和 (完全二叉树就是这种路径长度最短的二叉树)。
结点的带权路径长度:从根结点到该结点之间的路径长度与结点上权的乘积。
树的带权路径长度:树中所有叶子结点的带权路径长度之和。即树的各叶子结点(设为n个)所带的权值 wi 与从根到该叶子结点的路径长度 li 的乘积的和。
WPL = w1 * l1 + w2 * l2 +…+wn*ln(n = 1,2,…n)
假设有n 个权值 {w1, w2, …, wn},试构造一棵有n个叶子结点的二叉树,每个叶子结点带权为wi,则其中带权路径长度WPL最小的二叉树称作最优二叉树或赫夫曼树。

构造哈夫曼树算法步骤

1.根据给定的 n 个权值 {w1, w2, …, wn}, 构造 n 棵二叉树的集合F = {T1, T2, … , Tn},其中每棵二叉树中均只含一个带权值为 wi 的根结点,其左、右子树为空树;
2. 在 F 中选取其根结点的权值为最小的两棵二叉树,分别作为左、右子树构造一棵新的二叉树,并置这棵新的二叉树根结点的权值为其左、右子树根结点的权值之和。
3. 从F中删去这两棵树,同时加入刚生成的新树;
4. 重复 (2) 和 (3) 两步,直至 F 中只含一棵树为止。

哈夫曼树应用

利用赫夫曼树可以构造一种不等长的二进制编码,并且构造所得的赫夫曼编码是一种最优前缀编码,即使所传电文的总长度最短。(如图所示传输电文过程)
这里写图片描述

例:传输电文ABAACCADACCD

等长编码与解码过程

这里写图片描述

变长编码与解码过程

这里写图片描述

哈夫曼编码过程

这里写图片描述
在上述三种编码中,等长编码占用长度太大,而变长编码又在解码中会出现歧义,导致解码不唯一。在Huffman树中,字符i的Huffman编码对应根到叶子结点i的路径。因为叶子结点是没有子孙结点的,故根到一个叶子结点的路径不可能是根到另一个叶子结点的路径的前一段,即一个叶子结点对应的字符的Huffman编码不是另一个叶子结点对应的字符的Huffman编码的前缀,从而没有一个字符的Huffman编码是另一个字符的Huffman编码的前缀,所以Huffman编码是前缀编码,即Huffman编码是正确的。

代码实现(C语言)

#include "stdio.h"
#include "stdlib.h"
#include "string.h"

#define MAXSIZE 256
#define ERROR 0
#define TRUE 1

typedef struct HfNode{
    char data;
    int weight;
    int  rchild,lchild,parent;
    char *code;
}HfNode,*Hftree;

//选择两个最小的节点
void selectTwo(HfNode *hfArray, int count,int * pos1,int * pos2){
    int i =0,min = 0,min2 = 0;
    //选择第一最小
    for(i = 1; i<=count;i++){
        if(hfArray[i].parent == 0){
            if(min == 0){  //初始化
                min = hfArray[i].weight;
                (*pos1) = i;

            }
            if(hfArray[i].weight < min){
                min = hfArray[i].weight;
                (*pos1) = i;
            }
        }
    }
    //min2 = min; (*pos2) = (*pos1);
    for(i = 1;i<=count;i++){
        if(hfArray[i].parent ==0 && i != (*pos1)){
            if(min2==0){
                min2 = hfArray[i].weight;
                (*pos2) = i;
            }
            if(hfArray[i].weight < min2){
                min2 = hfArray[i].weight;
                (*pos2) = i;
            }
        }
    }
}


Hftree BulidHuffman(char *sourceStr,int *hfcount){
    int i = 0,s1 = 0,s2 = 0,j = 0; int k = 1,count = 0;   //count叶子节点个数
    int *pattern = (int *)malloc(sizeof(int) * MAXSIZE);
    Hftree hfmArray = (Hftree)malloc(sizeof(HfNode) * (MAXSIZE *2));  //最大容量
    for(i = 0;i<=2*MAXSIZE;i++){  //初始化
        hfmArray[i].code = (char *)malloc(sizeof(char) *MAXSIZE);
        hfmArray[i].lchild = 0;
        hfmArray[i].parent = 0;
        hfmArray[i].rchild = 0;
        hfmArray[i].weight = 0;
    }

    for(i = 0;i<MAXSIZE;i++){  //初始化
        pattern[i] = 0;
    }

    for(i = 0; i<strlen(sourceStr);i++){  //统计词频
        pattern[(int)sourceStr[i]]++;
    } /*for*/

    for(i = 0;i<MAXSIZE;i++){  //叶子节点
        if(pattern[i] !=0){
            hfmArray[k].data = (char)i;
            hfmArray[k].weight = pattern[i];
            k++;
        }
    }
    count = k - 1;  //总数
    j = count;
    printf("总数:%d\n",count);

    for(i = 0; i<j -1;i++){  //迭代次数
        selectTwo(hfmArray,count,&s1,&s2);
        hfmArray[k+i].weight = hfmArray[s1].weight + hfmArray[s2].weight;
        hfmArray[k+i].lchild = s1; hfmArray[k+i].rchild = s2;
        hfmArray[s1].parent = k+i;hfmArray[s2].parent = k+i;
        count++;

    }

    (*hfcount) = count;
    return hfmArray;
}


void traverse(Hftree hArray,int head,char *code,int pos){


    if(hArray[head].lchild == 0 && hArray[head].rchild == 0){
        code[pos] = '\0';
        strcpy(hArray[head].code,code);
        return;
    }
    if(hArray[head].lchild !=0){
        code[pos] = '0';
        code[pos+1] = '\0';
        traverse(hArray,hArray[head].lchild,code,pos+1);
    }
    if(hArray[head].rchild != 0){
        code[pos] = '1';
        code[pos+1] = '\0';
        traverse(hArray,hArray[head].rchild,code,pos+1);
    }
}
//创建huffman编码
void BuildHffmanCode(Hftree hArray,int count){
    int head1 = 0,i = 0;
    char *code = malloc(sizeof(char) * MAXSIZE);
    for(i = 1;i<=count;i++){
        if(hArray[i].parent==0){
            head1 = i;
            break;
        }
    }
    traverse(hArray,head1,code,0);
}

void encode(Hftree hfTree,char *str,int count){
    int i =0,j = 0; 
    for(i = 0;i < strlen(str);i++){
        for(j = 1;j<=count/2 +1;j++){
            if(str[i] == hfTree[j].data){
                //printf("%c:",str[i]);
                printf("%s",hfTree[j].code);
            }
        }
    }
}

void decode(Hftree hfArray,char *target,int count){

    int i =0,head = 0,j = 0;
        for(i = 1;i<=count;i++){
        if(hfArray[i].parent==0){
            head = i;
            break;
        }
    }
        printf("\n解码内容:");
        j = head;
    for(i = 0; i<strlen(target);i++){
        if(target[i]=='0'){
            j = hfArray[j].lchild;
            if(hfArray[j].lchild == 0&& hfArray[j].rchild ==0 && j!=0){
                printf("%c",hfArray[j].data);
                j = head;
            }
        }
        if(target[i] == '1'){
            j = hfArray[j].rchild;
            if(hfArray[j].lchild == 0&& hfArray[j].rchild ==0 && j!=0){
                printf("%c",hfArray[j].data);
                j = head;
            }
        }
    }
    printf("\n");
    if(j!=head){
        printf("要解码的字符串不符合要求....");
    }
}

void main(){
    int hfcount = 0;
    int i = 0;
    Hftree hfTree = BulidHuffman("zhang",&hfcount);
    BuildHffmanCode(hfTree,hfcount);

    encode(hfTree,"zhang",hfcount);  //编码
    decode(hfTree,"100011001111",hfcount);  //解码
}
#include #include #include #include using namespace std; # define MaxN 100//初始设定的最大结点数 # define MaxC 1000//最大编码长度 # define ImpossibleWeight 10000//结点不可能达到的权值 # define n 26//字符集的个数 //-----------哈夫曼的结点结构类型定义----------- typedef struct //定义哈夫曼各结点 { int weight;//权值 int parent;//双亲结点下标 int lchild;//左孩子结点下标 int rchild;//右孩子结点下标 }HTNode,*HuffmanTree;//动态分配数组存储哈夫曼 typedef char**HuffmanCode;//动态分配数组存储哈夫曼编码表 //-------全局变量-------- HuffmanTree HT; HuffmanCode HC; int *w;//权值数组 //const int n=26;//字符集的个数 char *info;//字符值数组 int flag=0;//初始化标记 //********************************************************************** //初始化函数 //函数功能: 从终端读入字符集大小n , 以及n个字符和n个权值,建立哈夫曼,并将它存于文件hfmTree中 //函数参数: //向量HT的前n个分量表示叶子结点,最后一个分量表示根结点,各字符的编码长度不等,所以按实际长度动态分配空间 void Select(HuffmanTree t,int i,int &s1,int &s2) { //s1为最小的两个值中序号最小的那个 int j; int k=ImpossibleWeight;//k的初值为不可能达到的最大权值 for(j=1;j<=i;j++) { if(t[j].weight<k&&t[j].parent==0) {k=t[j].weight; s1=j;} } t[s1].parent=1; k=ImpossibleWeight; for(j=1;j<=i;j++) { if(t[j].weight0),构造哈夫曼HT,并求出n个字符的哈弗曼编码HC { int i,m,c,s1,s2,start,f; HuffmanTree p; char* cd; if(num<=1) return; m=2*num-1;//m为结点数,一棵有n个叶子结点的哈夫曼共有2n-1个结点,可以存储在一个大小为2n-1的一维数组中 HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));//0号单元未用 //--------初始化哈弗曼------- for(p=HT+1,i=1;iweight=*w; p->parent=0; p->lchild=0; p->rchild=0; } for(i=num+1;iweight=0; p->parent=0; p->lchild=0; p->rchild=0; } //--------哈夫曼------------- for(i=num+1;i<=m;i++) { Select(HT,i-1,s1,s2);//在HT[1...i-1]选择parent为0且weight最小的两个结点,其序号分别为s1和s2 HT[s1].parent=i; HT[s2].parent=i; HT[i].lchild=s1; HT[i].rchild=s2;//左孩子权值小,右孩子权值大 HT[i].weight=HT[s1].weight+HT[s2].weight; } //-------从叶子到根逆向求每个字符的哈弗曼编码-------- HC=(HuffmanCode)malloc((num+1)*sizeof(char *));//指针数组:分配n个字符编码的头指针向量 cd=(char*)malloc(n*sizeof(char*));//分配求编码的工作空间 cd[n-1]='\0';//编码结束符 for(i=1;i<=n;i++)//逐个字符求哈弗曼编码 { start=n-1;//编码结束符位置 for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)//从叶子到跟逆向求哈弗曼编码 if(HT[f].lchild==c) cd[--start]='0';//判断是左孩子还是右孩子(左为0右为1) else cd[--start]='1'; HC[i]=(char*)malloc((num-start)*sizeof(char*));//按所需长度分配空间 int j,h; strcpy(HC[i],&cd[start]); } free(cd); } //****************初始化函数****************** void Initialization() { flag=1;//标记为已初始化 int i; w=(int*)malloc(n*sizeof(int));//为26个字符权值分配空间 info=(char*)malloc(n*sizeof(char));//为26个字符分配空间 ifstream infile("ABC.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i>info[i]; infile>>w[i]; } infile.close(); cout<<"读入字符成功!"<<endl; HuffmanCoding(HT,HC,w,n); //------------打印编码----------- cout<<"依次显示各个字符的值,权值或频度,编码如下"<<endl; cout<<"字符"<<setw(6)<<"权值"<<setw(11)<<"编码"<<endl; for(i=0;i<n;i++) { cout<<setw(3)<<info[i]; cout<<setw(6)<<w[i]<<setw(12)<<HC[i+1]<<endl; } //---------将建好的哈夫曼写入文件------------ cout<<"下面将哈夫曼写入文件"<<endl; ofstream outfile("hfmTree.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i<n;i++,w++) { outfile<<info[i]<<" "; outfile<<w[i]<<" "; outfile<<HC[i+1]<<" "; } outfile.close(); cout<<"已经将字符与对应的权值,编码写入根目录下文件hfmTree.txt"<<endl; } //*****************输入待编码字符函数************************* void Input() { char string[100]; ofstream outfile("ToBeTran.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } cout<<"请输入你想要编码的字符串(字符个数应小于100),以#结束"<>string; for(int i=0;string[i]!='\0';i++) { if(string[i]=='\0') break; outfile<<string[i]; } cout<<"获取报文成功"<<endl; outfile.close(); cout<<"------"<<"已经将报文存入根目录下的ToBeTran.txt文件"<<endl; } //******************编码函数**************** void Encoding() { int i,j; char*string; string=(char*)malloc(MaxN*sizeof(char)); cout<<"下面对根目录下的ToBeTran.txt文件中的字符进行编码"<<endl; ifstream infile("ToBeTran.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i>string[i]; } for(i=0;i<100;i++) if(string[i]!='#') cout<<string[i]; else break; infile.close(); ofstream outfile("CodeFile.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;string[i]!='#';i++) { for(j=0;j<n;j++) { if(string[i]==info[j]) outfile<<HC[j+1]; } } outfile<<'#'; outfile.close(); free(string); cout<<"编码完成------"; cout<<"编码已写入根目录下的文件CodeFile.txt中"<<endl; } //******************译码函数**************** void Decoding() { int j=0,i; char *code; code=(char*)malloc(MaxC*sizeof(char)); char*string; string=(char*)malloc(MaxN*sizeof(char)); cout<<"下面对根目录下的CodeFile.txt文件中的代码进行译码"<<endl; ifstream infile("CodeFile.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for( i=0;i>code[i]; if(code[i]!='#') { cout<<code[i]; } else break; } infile.close(); int m=2*n-1; for(i=0;code[i-1]!='#';i++) { if(HT[m].lchild==0) { string[j]=info[m-1]; j++; m=2*n-1; i--; } else if(code[i]=='1') m=HT[m].rchild; else if(code[i]=='0') m=HT[m].lchild; } string[j]='#'; ofstream outfile("TextFile.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } cout<<"的译码为------"<<endl; for( i=0;string[i]!='#';i++) { outfile<<string[i]; cout<<string[i]; } outfile<<'#'; outfile.close(); cout<<"------译码完成------"<<endl; cout<<"译码结果已写入根目录下的文件TextFile.txt中"<<endl; free(code); free(string); } //*************打印编码函数**************** void Code_printing() { int i; char *code; code=(char*)malloc(MaxC*sizeof(char)); cout<<"下面打印根目录下文件CodeFile.txt中的编码"<<endl; ifstream infile("CodeFile.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for( i=0;i>code[i]; if(code[i]!='#') cout<<code[i]; else break; } infile.close(); cout<<endl; ofstream outfile("CodePrin.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;code[i]!='#';i++) { outfile<<code[i]; } outfile.close(); free(code); cout<<"------打印结束------"<<endl; cout<<"该字符形式的编码文件已写入文件CodePrin.txt中"<<endl; } //*************打印哈夫曼函数**************** int numb=0; void coprint(HuffmanTree start,HuffmanTree HT) //start=ht+26这是一个递归算法 { if(start!=HT) { ofstream outfile("TreePrint.txt",ios::out); if(!outfile) { cerr<<"打开失败"<rchild,HT); //递归先序遍历 cout<<setw(5*numb)<weight<rchild==0) cout<<info[start-HT-1]<<endl; outfile<weight; coprint(HT+start->lchild,HT); numb--; outfile.close(); } } void Tree_printing(HuffmanTree HT,int num) { HuffmanTree p; p=HT+2*num-1; //p=HT+26 cout<<"下面打印赫夫曼"<<endl; coprint(p,HT); //p=HT+26 cout<<"打印工作结束"<<endl; } //*************主函数************************** int main() { char choice; do{ cout<<"************哈弗曼编/译码器系统***************"<<endl; cout<<"请选择您所需功能:"<<endl; cout<<":初始化哈弗曼"<<endl; cout<<":输入待编码字符串"<<endl; cout<<":利用已建好的哈夫曼进行编码"<<endl; cout<<":利用已建好的哈夫曼进行译码"<<endl; cout<<":打印代码文件"<<endl; cout<<":打印哈夫曼"<<endl; cout<<":退出"<<endl; if(flag==0) { cout<<"请先初始化哈夫曼,输入I"<<endl; cout<<""<>choice; switch(choice) { case 'I':Initialization();break; case 'W':Input();break; case 'E':Encoding();break; case 'D':Decoding();break; case 'P':Code_printing();break; case 'T':Tree_printing(HT,n);break; case 'Q':;break; default:cout<<"输入的命令出错,请重新输入!"<<endl; } }while(choice!='Q'); free(w); free(info); free(HT); free(HC); system("pause"); return 0; }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值