当前位置: 首页 > news >正文

哈夫曼树译码函数(Decoding) 该函数通过哈夫曼编码串和已构建的哈夫曼树,还原出原始字符序列

一、哈夫曼树译码函数(Decoding)
该函数通过哈夫曼编码串和已构建的哈夫曼树,还原出原始字符序列。其核心逻辑如下:

  1. 初始状态:从哈夫曼树的根节点开始(在数组表示中,根节点下标通常为2*n - 1,其中n是叶子节点数量)。
  2. 遍历编码串
    • 对于编码串中的每一位:
      • 若为'0',则跳转到当前节点的左孩子;
      • 若为'1',则跳转到当前节点的右孩子。
  3. 判断是否到达叶子节点
    • 当前节点的左右孩子均为 0(或为空),说明是叶子节点;
    • 此时输出该节点所代表的字符;
    • 然后重新回到根节点,继续后续译码。
  4. 终止条件:编码串全部位处理完毕,译码结束。

示例代码(C语言风格结构体与数组实现):

#include<stdio.h>#include<string.h>#defineMAX_NODE100typedefstruct{charch;// 存储字符intweight;// 权重intparent,lchild,rchild;// 双亲、左孩子、右孩子下标}HTNode;voidHuffmanDecode(HTNode ht[],introot,char*code,intn){inti=0;intcurrent=root;intlen=strlen(code);while(i<len){if(code[i]=='0'){current=ht[current].lchild;// 走左子树}elseif(code[i]=='1'){current=ht[current].rchild;// 走右子树}// 判断是否为叶子节点(左右孩子都为0)if(ht[current].lchild==0&&ht[current].rchild==0){printf("%c",ht[current].ch);// 输出对应字符current=root;// 回到根节点}i++;}printf("\n");}

二、树的存储结构

  1. 双亲表示法

    • 使用结构数组存储每个节点,每个节点包含数据、权重、双亲下标、左右孩子下标等信息。
    • 优点:便于向上查找祖先节点,适合构造哈夫曼树;
    • 缺点:查找孩子节点效率低,需遍历整个数组。
  2. 孩子表示法

    • 每个节点保存一个链表或动态数组,记录所有孩子节点的下标或指针;
    • 适用于多叉树,如文件系统目录结构;
    • 查找孩子高效,但空间开销较大。
  3. 孩子兄弟表示法(左孩子-右兄弟表示法)

    • 每个节点包含两个指针:“第一个孩子” 和 “右兄弟”;
    • 可将任意树转化为二叉树形式进行存储和操作;
    • 特别适合递归遍历和森林转换为二叉树的应用场景。

这些存储方式广泛应用于数据压缩(如哈夫曼编码)、操作系统目录管理、编译器语法树构建等领域。
构建哈夫曼树并生成编码表是数据压缩中的核心步骤,主要包括两个阶段:建树编码生成。以下是详细过程与实现方法。


一、构建哈夫曼树(Huffman Tree)

基本思想:

采用贪心算法,每次从所有节点中选取权值最小的两个节点,合并成一个新的内部节点,其权值为两者之和,直到只剩一棵树。

步骤:
  1. 给定 n 个字符及其出现频率(或权重),每个字符作为叶子节点。
  2. 构造一个优先队列(最小堆),按权值排序。
  3. 重复以下操作 (n-1) 次:
    • 取出权值最小的两个节点 A 和 B;
    • 创建新节点 C,C 的权值 = A.权值 + B.权值;
    • 将 A 设为 C 的左孩子,B 为右孩子(或反之);
    • 将 C 插入优先队列。
  4. 最后剩下的节点即为哈夫曼树的根。
存储结构(双亲表示法数组):

使用结构体数组HTNode ht[2*n],索引从 1 开始:

typedefstruct{charch;// 字符intweight;// 权重intparent;// 双亲下标intlchild;// 左孩子下标intrchild;// 右孩子下标}HTNode;

初始化时,前 n 个节点为叶子节点(字符+权重),parent 初始为 0;后续 n-1 个节点用于存储合并后的非叶节点。

示例代码(C语言风格):
voidCreateHuffmanTree(HTNode ht[],intn){intm=2*n-1;for(inti=1;i<=m;i++){ht[i].parent=ht[i].lchild=ht[i].rchild=0;}for(intk=n+1;k<=m;k++){intmin1=9999,min2=9999;intx1=0,x2=0;// 找两个无父节点且权值最小的节点for(intj=1;j<k;j++){if(ht[j].parent==0&&ht[j].weight<min1){min2=min1;x2=x1;min1=ht[j].weight;x1=j;}elseif(ht[j].parent==0&&ht[j].weight<min2){min2=ht[j].weight;x2=j;}}// 合并两个节点ht[k].weight=min1+min2;ht[k].lchild=x1;ht[k].rchild=x2;ht[x1].parent=k;ht[x2].parent=k;}}

二、生成哈夫曼编码表

原理:

从每个叶子节点出发,逆向回溯到根节点,路径上每一步:

  • 走左分支记为'0'
  • 走右分支记为'1'
    由于是从下往上生成,需将结果反转得到正确编码。
方法:逐个叶子节点遍历
#include<string.h>voidGenerateHuffmanCode(HTNode ht[],charhcode[][20],intn){chartemp[20];inttop=0;for(inti=1;i<=n;i++){intcurrent=i;intparent=ht[i].parent;top=0;// 从叶子向上遍历至根while(parent!=0){if(ht[parent].lchild==current)temp[top++]='0';elsetemp[top++]='1';current=parent;parent=ht[parent].parent;}// 反转字符串并存入编码表temp[top]='\0';for(intj=0;j<top;j++){hcode[i][j]=temp[top-1-j];}hcode[i][top]='\0';}}
编码表示方式:

使用二维字符数组hcode[i][20]存储第 i 个字符的哈夫曼编码。


完整流程示例(以字符频率 {‘A’:5, ‘B’:9, ‘C’:12, ‘D’:13, ‘E’:16, ‘F’:45} 为例)

字符频率哈夫曼编码
A51100
B91101
C12111
D13100
E16101
F450

注意:编码不唯一(左右子树可互换),但总带权路径长度 WPL 是最优的。


http://www.jsqmd.com/news/172540/

相关文章:

  • 【开题答辩全过程】以 “实惠”药房管理系统为例,包含答辩的问题和答案
  • R语言变量重要性分析完全指南(20年专家压箱底技巧)
  • YOLOv8笔记本电脑运行可行性分析
  • 【机器学习模型优化必读】:基于R语言的交叉验证最佳实践
  • 986页标书,1小时译完!省下3万元,专业又精准!
  • YOLOv8灾难性遗忘问题缓解方法
  • 【2025年度总结】从代码萌新到万粉博主:AI赋能下的破局与生长
  • YOLOv8 WASI实验性支持进展
  • R语言数据预处理革命(GPT智能辅助清洗全流程曝光)
  • YOLOv8专家咨询服务上线:定制化解决方案提供
  • YOLOv8 Raspberry Pi适配进展更新
  • 树的存储表示法是数据结构中处理树形结构的基础,针对不同的操作需求,设计了多种存储方式以提高效率
  • YOLOv8代码搜索:git grep高效查找方法
  • vue springboot基于协同过滤算法的酒店评分推荐系统的设计与实现_tv7ng
  • java11.28
  • 2026年1月深圳牙科推荐:麦芽口腔——技术为先,守护您的矫牙与拔牙体验 - 深度智识库
  • 在构建RAG系统时,是选择成熟的云解析服务,还是用开源工具自建解析流水线?
  • YOLOv8社区生态建设现状与发展趋势
  • 执医考试听哪个老师的课?深度解析阿虎医考讲师风格与选择策略 - 医考机构品牌测评专家
  • YOLOv8 FP16与BF16精度对比实测结果
  • YOLOv8手机端运行效果评测(Android/iOS)
  • java12.3
  • 2026年十大GEO服务公司推荐榜:实力评测与选择指南 - 资讯焦点
  • 【R语言变量重要性评估实战】:掌握5大工具提升模型解释力
  • YOLOv8硬件选型推荐:性价比GPU榜单
  • YOLOv8推理实战:加载yolov8n.pt模型识别bus.jpg图像
  • YOLOv8撤销更改:reset、revert、checkout对比
  • YOLOv8中间层特征提取与聚类分析
  • YOLOv8品牌LOGO设计理念揭秘
  • 短标签一句话实战-LitCTF2025-easy_file