当前位置: 首页 > news >正文

数值方法 4.23 课堂作业 —— EM算法(E步)

数值方法 4.23 课堂作业 —— EM算法(E步)

注:本文 极有可能 含有 AI 生成的内容,请仔细甄别(

问题描述

在一个封闭盒子中,有两类外观完全相同但内部均匀程度不同的硬币,记作 A 和 B。
已知初始猜测:

  • A 类硬币在盒子中的占比:\(40\%\)
  • 投掷 A 硬币正面向上的概率:\(80\%\)
  • 投掷 B 硬币正面向上的概率:\(30\%\)

记正面向上、反面向上分别为 \(H,T\)

我们投掷一次硬币,结果为正面向上


第(1)问

已知

\[P(A) = 0.4,\quad P(B) = 0.6 \\ P(H \mid A) = 0.8,\quad P(H \mid B) = 0.3 \]

:$ P(A \mid H) $

(EM算法中的E步,即贝叶斯公式):

\[\begin{aligned} P(A \mid H) &= \frac{P(H \mid A)P(A)}{P(H \mid A)P(A) + P(H \mid B)P(B)} \\ &= \frac{0.8 \times 0.4}{0.8 \times 0.4 + 0.3 \times 0.6} \\ &= 0.64 \end{aligned} \]

答案:这枚硬币属于 A 类的概率是 0.64


第(2)问

修改条件(仅改变正面概率):

\[P(H \mid A) = 0.9,\quad P(H \mid B) = 0.01 \]

其余不变:\(P(A) = 0.4,\quad P(B) = 0.6\)

求解

\[P(A \mid H) = \frac{0.9 \times 0.4 = 0.36}{0.36 + 0.01 \times 0.6 = 0.366} \approx 0.9836 \]

答案:约为 0.9836

所以观测到正面,极有可能是 A。


第(3)问

修改条件(仅改变先验占比):

\[P(A) = 0.1,\quad P(B) = 0.9 \]

求解

\[P(A \mid H) = \frac{0.8 \times 0.1 = 0.08}{0.08 + 0.3 \times 0.9 = 0.35} \approx 0.2286 \]

答案:约为 0.2286

即使观测到正面,由于 A 本身非常稀少,其后验概率仍然不高。


第(4)问:EM算法E步的数学含义及初始值影响

E步的数学含义

在 EM 算法中,E步(Expectation Step) 的核心是:

利用当前模型参数的估计值,计算 隐变量 在给定观测数据下的 后验概率分布

本题中:

  • 隐变量:硬币属于 A 还是 B
  • 观测数据:一次正面
  • 当前参数:$ P(A), P(B), P(H \mid A), P(H \mid B) $
  • E步输出:$ P(A \mid H) $

数学上就是 贝叶斯公式

\[P(Z \mid X, \theta) = \frac{P(X \mid Z, \theta) P(Z \mid \theta)}{\sum_Z P(X \mid Z, \theta) P(Z \mid \theta)} \]

不同初始值对EM的影响

初始参数变化 对 E 步结果的影响 对最终参数估计的影响
$ P(H \mid A) $ 偏高 后验概率更倾向于 A 可能高估 A 的正面概率
$ P(H \mid A) $ 偏低 后验概率更倾向于 B 可能低估 A 的正面概率
$ P(A) $ 先验偏低 即使看到正面,A 的后验仍偏低 需要更多证据才能纠正
极端初始值(如 $ P(H \mid B) \to 0 $) E 步输出极端结果 可能陷入局部最优或收敛变慢

核心规律

  • EM 算法对初始值 敏感
  • 不同初始值可能导致收敛到不同局部最优
  • E 步本质是“用当前信念更新对隐变量的认知”
  • 多轮迭代可以部分修正初始偏差,但无法保证全局最优

第(5)问:多次投掷

  • 同一枚硬币,独立投掷 3 次,结果为:正、反、正(H, T, H)
  • 使用第(1)问中的初始参数:

\[P(A)=0.4,\quad P(H \mid A)=0.8,\quad P(H \mid B)=0.3 \]

计算似然

\[P(HTH \mid A) = 0.8 \times (1-0.8) \times 0.8 = 0.8 \times 0.2 \times 0.8 = 0.128\\ P(HTH \mid B) = 0.3 \times (1-0.3) \times 0.3 = 0.3 \times 0.7 \times 0.3 = 0.063 \]

求解:

\[P(A \mid HTH) = \frac{0.128 \times 0.4 = 0.0512}{0.0512 + 0.063 \times 0.6 = 0.0890} \approx 0.5753 \]

答案:约为 0.5753

解释:单次正面时 ( P(A \mid H)=0.64 ),加入反面观测后,由于反面更支持 B(B 出反概率 0.7 > A 出反概率 0.2),A 的后验概率下降至 0.575。

http://www.jsqmd.com/news/740939/

相关文章:

  • 掌握bypy文件对比:3步实现百度云与本地文件完美同步
  • 终极免费暗黑2存档编辑器:轻松修改D2S文件,打造完美角色!
  • 如何用 markdown-pdf 创建专业文档:从安装到高级配置
  • 2026年PMP认证推荐指南:含金量/费用/避坑全对比 - 众智商学院课程中心
  • Kasetto:轻量级单向文件同步工具,实现高效备份与部署
  • 3步快速掌握:WindowResizer终极窗口尺寸强制调整工具完整指南
  • 创建 / 修改 / 删除视图
  • 使用Taotoken CLI工具一键配置Codex模型调用环境
  • Phi-mini-MoE-instruct多专家路由机制:不同任务触发不同expert实测
  • NNI调参实战避坑指南:从搜索空间配置到Web UI监控,我的踩坑记录
  • Mitsuba 2偏振渲染技术:完整的光学模拟解决方案
  • 终极TensorRT_Pro指南:快速掌握代码规范、调试技巧与性能调优
  • React Native Background Geolocation:终极跨平台位置跟踪解决方案
  • Penlight完全指南:10个核心模块助你快速提升Lua开发效率
  • Swift原生大语言模型本地化部署:LLM.swift架构解析与实战指南
  • VoDSL技术:中小企业高效通信解决方案
  • 【Linux从入门到精通】第50篇:专栏总结与Linux学习之路的未来展望
  • 如何免费实现跨平台图表设计:drawio-desktop完整指南
  • 裸机OTA升级配置崩溃定位难?用GDB+汇编级断点追踪C语言跳转表溢出问题(含调试脚本)
  • 从‘球员兼裁判’到‘动态切换身份’:聊聊权限系统中的职责分离(SoD)实战与坑
  • Duplex流进阶:stream-adventure duplexer问题深度剖析
  • Godot游戏练习01-第33节-新增会爆炸的敌人
  • Pytorch图像去噪实战(二十一):FastAPI部署图像去噪模型,搭建可调用的图片降噪服务
  • 技术首发|基于企业标准的元数据白皮书解析,可信数字身份治理方案出炉
  • Joy-Con Toolkit完全指南:终极Switch手柄调校解决方案
  • 告警静默期怎么破?聊聊Nightingale告警规则里的‘仅本业务组生效’与团队管理的那些事儿
  • LoFT框架:长尾数据与半监督学习的高效解决方案
  • DAMO-YOLO惊艳案例:AR眼镜中第一视角实时目标标注与语音提示
  • Universal Extractor 2:500+文件格式一键提取的终极解决方案
  • 一次真实的渗透复盘:我是如何漏掉蓝凌OA的RCE漏洞,以及如何补救的