当前位置: 首页 > news >正文

信息论与编码篇---DMS信源编码

一、什么是DMS信源编码?

DMSDiscrete Memoryless Source(离散无记忆信源)的缩写。

拆开解释:

  • 离散:信源输出的符号是有限的,比如英文字母、汉字、0/1比特

  • 无记忆:每次输出符号互不影响,就像抛硬币,这次抛的和下次抛的没关系

  • 信源编码:把信源符号转换成0/1比特流的过程

一句话总结:DMS信源编码就是要把一个个独立的符号,用最少的比特数表示出来。

二、为什么要做信源编码?

想象你要发一份电报:

  • 原文:"AAAAAAAAAB"(10个字符)

  • 一种编码:每个字母用8比特,总共80比特

  • 聪明编码:"9A1B"(用数字代表重复次数),只需要很少的比特

信源编码的目的就是去掉冗余,压缩数据

三、核心思想:用更短的码表示更常见的符号

举个生活中的例子

假设一个信源只输出A、B、C、D四个字母,概率分别是:

  • A:50%(最常见)

  • B:25%

  • C:12.5%

  • D:12.5%

笨办法(等长编码):

  • 每个字母用2比特:A=00, B=01, C=10, D=11

  • 平均码长 = 2比特/符号

聪明办法(变长编码):

  • A(最常见)→ 0(1比特)

  • B → 10(2比特)

  • C → 110(3比特)

  • D → 111(3比特)

  • 平均码长 = 0.5×1 + 0.25×2 + 0.125×3 + 0.125×3 =1.75比特/符号

结果:节省了12.5%的比特!

四、重要概念:熵(Entropy)

熵是信源的理论极限,表示每个符号最少需要多少比特

公式:H = -Σ p(i) × log₂ p(i)

上面例子的熵:

  • H = -(0.5×log₂0.5 + 0.25×log₂0.25 + 0.125×log₂0.125 + 0.125×log₂0.125)

  • H = -(0.5×(-1) + 0.25×(-2) + 0.125×(-3) + 0.125×(-3))

  • H = 0.5 + 0.5 + 0.375 + 0.375 =1.75比特

发现了吗?我们的聪明编码正好达到了熵的极限!

五、香农第一定理(无失真信源编码定理)

这个定理告诉我们:

  1. 平均码长 ≥ 熵(不能比熵更短)

  2. 可以无限接近熵(通过更好的编码方法)

就像:

  • 熵是行李箱的最小体积

  • 编码是怎么把东西装进去

  • 理论上可以装到刚好满,但永远不能超过

六、常见的DMS信源编码方法

1. 香农-范诺编码

  • 将符号按概率排序

  • 分成概率相近的两组,分别给0和1

  • 递归进行,直到每个符号都有唯一编码

2. 霍夫曼编码(最常用)

  • 从概率最小的两个符号开始

  • 合并它们,形成新的节点

  • 重复直到只剩一个节点

  • 反向得到每个符号的编码

霍夫曼编码是最优的,能给出最短的平均码长。

七、生活中的例子

例子1:莫尔斯电码

  • E(最常见)用 "."(最短)

  • Q(罕见)用 "--.-"(长)

  • 这就是一种直观的信源编码

例子2:文件压缩

  • ZIP、RAR都用了类似原理

  • 出现多的字符用短编码

  • 出现少的用长编码

例子3:H.264视频编码

  • 运动少的画面用短码

  • 复杂画面用长码

  • 但保证解码后能完全恢复

八、Mermaid总结框图

九、核心启示

  1. 信源编码就是数据压缩,要去掉冗余

  2. 熵是理论下限,告诉我们最多能压缩多少

  3. 常见符号用短码,罕见符号用长码

  4. 霍夫曼编码是最优的变长编码方法

  5. 可以无限接近熵,但永远不能低于熵

打个比方:就像整理行李箱,熵告诉你箱子最小能有多小,而信源编码就是各种巧妙的叠衣服方法,让你尽可能装进更多东西。霍夫曼编码就是那个最聪明的叠衣服高手!

http://www.jsqmd.com/news/382796/

相关文章:

  • 为什么你的AI提示设计没人用?提示工程架构师必须避开的7个用户参与误区
  • BUUCTF Misc 流量分析题单
  • 【信息科学与工程学】【管理科学】 第三篇 商业模式
  • 2026年云手机平台推荐榜单:安卓/iOS/多品牌/多型号/测试/办公/游戏/企业云手机平台,高效稳定智能云端解决方案 - 品牌企业推荐师(官方)
  • 自动控制原理 记录2
  • 【数据库】【Redis】缓存监控体系深度解析:从 BigKeys 到慢查询 - 详解
  • 2/14
  • 信息论与编码篇---信源编码
  • 2026年 毛绒印花/渗透印花/直喷渗透印花面料厂家推荐排行榜:创新工艺与高端质感面料品牌深度解析 - 品牌企业推荐师(官方)
  • 京东e卡回收超简单 几分钟就能搞定! - 京顺回收
  • FastAPI 与 Langchain、Coze、Dify 技术深度对比分析
  • AI产品必懂的100个概念(非常详细),RAG、Agent全解析,收藏这一篇就够了!
  • 基于TensorFlow的物联网大数据预测分析实战
  • 计算机毕业设计springboot浙江省历史文化遗产数字博物馆 基于SpringBoot框架的浙江非遗文化数字化展示与管理系统 浙江历史文化资源在线保护与传播平台的设计与实现
  • 计算机毕业设计springboot灵活用工系统 基于SpringBoot的弹性人力资源调度平台设计与实现 零工经济模式下智能用工匹配系统的开发与应用
  • 民银资本2025财报解码:1.7亿港元净利创纪录,资管+投行双轮驱动格局成型。
  • The Scientist
  • 2026年 安全阀厂家推荐排行榜:弹簧式/不锈钢/工业/燃料电池用安全阀,精准调节与高可靠性品牌深度解析 - 品牌企业推荐师(官方)
  • 2026年车库顶板排水系统厂家推荐排行榜:虹吸排水/零坡度排水/海绵城市种植顶板排水,创新技术与高效解决方案深度解析 - 品牌企业推荐师(官方)
  • 南大pa
  • 《7天学会Redis》Day 7 - Redisson 全览 - 实践
  • 1.创建实体类UserInfo
  • 细胞群体动力学仿真软件:CompuCell3D_(21).CompuCell3D在医学研究中的应用
  • rider开发asp.net webform工程
  • 程序员如何利用AI进行用户故事优先级排序
  • 巴菲特的投资方法与市场机遇
  • 2026年 泡沫雕塑厂家推荐排行榜,大型/卡通/景观/动物/假山泡沫雕塑,创意定制与精湛工艺口碑之选 - 品牌企业推荐师(官方)
  • 如何用Superset构建企业级大数据可视化平台?
  • 智能产品推荐AI系统的用户反馈处理,AI应用架构师的应对策略
  • 电脑系统垃圾清理软件的系统优化工具Wise Care 365 Pro绿色版,系统优化,C盘垃圾清理等。。