当前位置: 首页 > news >正文

信息论与编码篇---信源编码

一、信源编码的分类

信源编码主要分为三大类:

  • 无失真编码(可完全恢复原始数据)

  • 限失真编码(允许一定误差,换更高压缩率)

  • 感知编码(利用人类感知特性)

二、常见信源编码详细介绍

1. 霍夫曼编码(Huffman Coding)

核心思想:给高频符号短码,低频符号长码,像给常用字编个简短代号。

怎么做的

  1. 统计每个符号出现的概率

  2. 把概率最小的两个符号合并

  3. 重复直到只剩一个节点

  4. 从根节点往回分配0和1

举个栗子
字符:A(60%), B(20%), C(10%), D(10%)
编码结果:A→0, B→10, C→110, D→111

优点:最优变长编码,解码简单
缺点:需要预先知道概率分布
应用:ZIP压缩、JPEG(的一部分)

2. 算术编码(Arithmetic Coding)

核心思想:不把每个符号单独编码,而是把整个消息映射到[0,1)区间的一个小数。

怎么做的

  1. 初始区间[0,1)

  2. 每个符号到来,按概率缩小区间

  3. 最后用区间内的任意小数代表整个序列

举个栗子
消息"ABC",概率A=0.5,B=0.25,C=0.25
→ 最终区间[0.375,0.4375)
→ 取0.4(二进制0.0110011...)表示整个"ABC"

优点:压缩率更高,接近熵极限
缺点:计算复杂,对错误敏感
应用:H.264视频、JPEG2000、7z压缩

3. 游程编码(Run-Length Encoding, RLE)

核心思想:把连续重复的符号用"符号+重复次数"表示。

举个栗子
原始:AAAAABBBCCCCCC
编码:A5B3C6

优点:超简单,处理重复数据极高效
缺点:对不重复的数据反而会增大体积
应用:BMP图像、传真机、早期压缩

4. LZ系列编码(Lempel-Ziv)

核心思想:建立字典,用指针指向之前出现过的重复字符串。

怎么做的(LZ77):

  1. 维护一个滑动窗口

  2. 发现重复字符串时,用(距离,长度)代替

  3. 接收端根据指针重建原文

举个栗子
"ABABAB" → 先发"AB",遇到第二个"AB"时发(2,2)表示"往前2个字符,复制2个"

优点:不需要预先统计概率,自适应性强
缺点:实现复杂,需要缓冲区
应用:GIF、PNG、ZIP(LZ77+霍夫曼)

5. 变换编码(Transform Coding)

核心思想:把信号从时域变换到频域,保留重要频率,舍弃不重要的。

怎么做的(以JPEG为例):

  1. 把图像分成8×8小块

  2. 用DCT变换到频域

  3. 保留低频系数(人眼敏感),舍弃高频(人眼不敏感)

  4. 量化(造成失真的关键步骤)

  5. 编码剩余系数

优点:压缩率高,能利用人类感知特性
缺点:有失真,计算量大
应用:JPEG、MP3、H.264

6. 预测编码(Predictive Coding)

核心思想:不编码原始值,只编码预测值与实际值的差值。

怎么做的

  1. 根据前面的数据预测当前值

  2. 计算预测误差(通常很小)

  3. 编码这个误差值

举个栗子
像素值:100, 101, 102, 103
预测:下一个≈上一个
差值:+1, +1, +1(比原始值小得多)

优点:利用数据相关性,差值动态范围小
缺点:预测不准时效果差
应用:DPCM、语音编码、无损JPEG

7. 矢量量化(Vector Quantization, VQ)

核心思想:不一个个编码数值,而是把一组数值(矢量)一起编码,用码本中的索引代替。

怎么做的

  1. 预先训练一个码本(典型矢量的集合)

  2. 把输入数据分成矢量

  3. 找码本中最接近的矢量

  4. 只传输索引

优点:高压缩比,适合有失真场景
缺点:码本设计复杂,需要训练
应用:语音编码、图像压缩、人脸识别

三、编码方法对比表

编码方法类型压缩比有无失真复杂度适用场景
霍夫曼统计编码通用文件压缩
算术编码统计编码视频、图像
游程编码字典编码极低二值图像、传真
LZ系列字典编码中高ZIP、GIF
变换编码变换编码图像、视频
预测编码预测编码两者都有语音、图像
矢量量化量化编码语音、特征压缩

四、Mermaid总结框图

五、实际应用中的组合拳

现实中的压缩标准都是多种编码方法的组合:

JPEG图像压缩

  1. 颜色空间转换

  2. DCT变换(变换编码)

  3. 量化(限失真)

  4. Z字形扫描

  5. 霍夫曼编码(或算术编码)

ZIP文件压缩

  1. LZ77(找重复字符串)

  2. 霍夫曼编码(压缩LZ77的输出)

H.264视频压缩

  1. 帧内/帧间预测(预测编码)

  2. DCT变换(变换编码)

  3. 量化

  4. CAVLC/CABAC(算术编码变种)

六、核心启示

  1. 没有万能编码:不同场景选择不同方法

  2. 组合优于单一:实际系统都是多种编码组合

  3. 无失真vs限失真:根据需求选择,图像视频常用限失真获得更高压缩比

  4. 复杂度vs压缩率:压缩率越高,通常复杂度也越高

打个比方:信源编码就像打包行李的各种技巧:

  • 霍夫曼编码:把常穿的衣服放上面(高频短码)

  • 游程编码:把同样的袜子卷在一起(重复压缩)

  • 变换编码:把羽绒服抽真空(变换后更省空间)

  • 矢量量化:用"套装"的概念打包(矢量代替单个)

实际旅行中(实际应用中),我们会组合使用这些技巧,达到最好的打包效果!

http://www.jsqmd.com/news/382788/

相关文章:

  • 2026年 毛绒印花/渗透印花/直喷渗透印花面料厂家推荐排行榜:创新工艺与高端质感面料品牌深度解析 - 品牌企业推荐师(官方)
  • 京东e卡回收超简单 几分钟就能搞定! - 京顺回收
  • FastAPI 与 Langchain、Coze、Dify 技术深度对比分析
  • AI产品必懂的100个概念(非常详细),RAG、Agent全解析,收藏这一篇就够了!
  • 基于TensorFlow的物联网大数据预测分析实战
  • 计算机毕业设计springboot浙江省历史文化遗产数字博物馆 基于SpringBoot框架的浙江非遗文化数字化展示与管理系统 浙江历史文化资源在线保护与传播平台的设计与实现
  • 计算机毕业设计springboot灵活用工系统 基于SpringBoot的弹性人力资源调度平台设计与实现 零工经济模式下智能用工匹配系统的开发与应用
  • 民银资本2025财报解码:1.7亿港元净利创纪录,资管+投行双轮驱动格局成型。
  • The Scientist
  • 2026年 安全阀厂家推荐排行榜:弹簧式/不锈钢/工业/燃料电池用安全阀,精准调节与高可靠性品牌深度解析 - 品牌企业推荐师(官方)
  • 2026年车库顶板排水系统厂家推荐排行榜:虹吸排水/零坡度排水/海绵城市种植顶板排水,创新技术与高效解决方案深度解析 - 品牌企业推荐师(官方)
  • 南大pa
  • 《7天学会Redis》Day 7 - Redisson 全览 - 实践
  • 1.创建实体类UserInfo
  • 细胞群体动力学仿真软件:CompuCell3D_(21).CompuCell3D在医学研究中的应用
  • rider开发asp.net webform工程
  • 程序员如何利用AI进行用户故事优先级排序
  • 巴菲特的投资方法与市场机遇
  • 2026年 泡沫雕塑厂家推荐排行榜,大型/卡通/景观/动物/假山泡沫雕塑,创意定制与精湛工艺口碑之选 - 品牌企业推荐师(官方)
  • 如何用Superset构建企业级大数据可视化平台?
  • 智能产品推荐AI系统的用户反馈处理,AI应用架构师的应对策略
  • 电脑系统垃圾清理软件的系统优化工具Wise Care 365 Pro绿色版,系统优化,C盘垃圾清理等。。
  • 2026免费论文检测网站口碑排行,为你筛选优质平台,知网查重/Paperyy/AIGC论文检测,论文检测网站哪个好 - 品牌推荐师
  • 边抢红包边构思论文,元宝这下子无敌了
  • 2026年2月贵州户外塑木地板厂家推荐,户外耐候建材选购攻略 - 品牌鉴赏师
  • 2026年 分散剂厂家推荐排行榜,造纸涂料/无机颜料助磨/轻钙助滤/重钙研磨/食品级碳酸钙/盾构机冲洗等专用分散剂优质品牌深度解析 - 品牌企业推荐师(官方)
  • 实用策略!提示工程架构师分享提示工程心理健康实用策略
  • 2026年 东莞武术培训实力机构推荐榜:专业特训、少儿功夫、寒暑假集训与周末业余课程全解析 - 品牌企业推荐师(官方)
  • 2026年旋转锉厂家实力推荐榜:单齿/双齿/成型旋转锉,匠心精工,高效耐磨,专业制造商深度解析与选购指南 - 品牌企业推荐师(官方)
  • 1. UserInfo表的创建