当前位置: 首页 > news >正文

先验和后验

先验是在观察数据或证据之前基于已有知识形成的判断或信念。

后验是在观察数据或证据之后,综合了新旧信息更新而成的判断或信念。

贝叶斯公式:

\[P(D|T) = \frac{ P(T|D) × P(D) }{P(T)} \]

例子:疾病检测

先验:某疾病在总人口中的患病率是1%(基于历史数据)。

证据:小明做了该疾病的检测,结果为阳性。已知检测的准确率(真阳性率)为95%,误报率(假阳性率)为5%。

后验:根据贝叶斯公式计算,在检测为阳性的条件下,小明真正患病的概率可能只有约16%,而不是95%。这个16%就是后验概率,它修正了仅看到阳性结果时的直觉(先验信息“患病率低”起到了关键作用)。

怎么算的?

我们假设:

  • 事件 D:实际上患病。
  • 事件 T:检测结果为阳性。

已知数据:

  1. 先验概率(患病率)P(D) = 0.01 (1%)。这意味着在检测前,随机一个人患病的概率是1%。相应地,健康的概率 P(非D) = 0.99
  2. 检测的灵敏度(真阳性率)P(T|D) = 0.95 (95%)。这表示,如果一个人真的患病,检测结果为阳性的概率是95%。
  3. 误报率(假阳性率)P(T|非D) = 0.05 (5%)。这表示,如果一个人健康,检测结果却错误显示为阳性的概率是5%。

我们的目标是计算 后验概率 P(D|T),即在检测结果为阳性的条件下,小明真正患病的概率是多少?

贝叶斯公式:

\[P(D|T) = \frac{ P(T|D) × P(D) }{P(T)} \]

其中 P(T) 是检测结果为阳性的总概率。阳性结果可能来自两部分人:真阳性(患病且检测阳性)和 假阳性(健康但检测阳性)。

因此,我们需要先计算 P(T),下边用!D表示非D:

\[P(T) = P(T|D) × P(D) + P(T|!D) × P(!D) \\P(T) = (0.95 × 0.01) + (0.05 × 0.99) \\P(T) = 0.0095 + 0.0495 \\P(T) = 0.059 \]

现在我们将所有值代入贝叶斯公式:

\[P(D|T) = [ P(T|D) × P(D) ] / P(T) \\P(D|T) = (0.95 × 0.01) / 0.059 \\P(D|T) = 0.0095 / 0.059 \\P(D|T) ≈ 0.161 \]

所以,P(D|T) ≈ 16.1%。

为什么直觉是错的?

我们可以通过想象一个包含10000人的大样本来直观理解:

我们来看所有检测为阳性的人:

  • 真阳性:10,000 × 1% × 95% = 95人(患病且检测阳性)
  • 假阳性:10,000 × 99% × 5% =495人(健康但检测阳性)
  • 阳性总人数:95 + 495 = 590人

在所有检测出阳性的人(590人)里,绝大多数(495人)其实都是健康的假阳性!这是因为健康人群的基数(9900人)太大了,即使误报率很低(5%),产生的假阳性绝对数量也会远远超过真阳性。

http://www.jsqmd.com/news/351189/

相关文章:

  • 06
  • 2026厦门海沧装修公司哪家强?口碑榜单+避坑攻略,装修小白秒懂! - 品牌测评鉴赏家
  • 同安宝藏装修公司大揭秘!看完再装不踩坑 - 品牌测评鉴赏家
  • 16 Electron 应用自动更新方案:electron-updater 完整指南 - 详解
  • 【计算机毕业设计案例】-基于Python的招聘岗位就业可视化系统基于Python的就业网站可视化系统设计与实现(程序+文档+讲解+定制)
  • ROCm rocr-libhsakmt分析系列4: HsaMemFlags分析
  • CANN推理优化实战:cann-recipes-infer项目详解
  • 2026厦门湖里装修公司怎么选?避坑攻略,刚需/改善党必看 - 品牌测评鉴赏家
  • Python毕设项目推荐-基于Python大数据的就业网站可视化系统设计与实现基于Python的就业网站可视化系统设计与实现【附源码+文档,调试定制服务】
  • Python毕设选题推荐:基于Python的就业网站可视化系统设计与实现基于Python大数据的就业网站可视化系统设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 微信小程序Python-uniapp校园二手交易平台系统
  • java+vue基于springboot的基于协同过滤算法的跳蚤市场商品推荐系统_9k725cw1
  • 包装从创意设计到生产的全流程研究:基于多品类消费品的实证分析 - 宏洛图品牌设计
  • 计算机Python毕设实战-基于Python的就业网站可视化系统设计与实现基于Python+Echarts的就业网站可视化系统设计与实现【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • java+vue基于springboot的基于AI智能问答的实验室预约系统 实验室设备报修系统 实验室设备租赁系统_02597u66
  • 论文开题报告不用愁!实测6款AI免费写作工具,一键搞定选题与报告初稿! - 麟书学长
  • Python+djangoWeb的校园集市管理系统
  • qt 中progressBar控件,如何设置颜色,如何将10% 文字显示在进度条中心
  • Python+djangoWeb的点餐系统的设计与实现
  • 2026寒假牛客2.5
  • java+vue基于springboot的基于ai智能问答的演唱会购票选座系统的设计与实现_2qc3ph90
  • CFD模拟的基本流程与关键环节解析:从需求定义到结果验证的全链路指南
  • AI在测试中的核心应用场景(5)
  • 【课程设计/毕业设计】基于Python+Echarts的就业网站可视化系统设计与实现基于Python的就业网站可视化系统设计与实现【附源码、数据库、万字文档】
  • 数学建模是什么?——经济管理中的核心工具、建模流程与实战
  • 【Transformer分类】基于Transformer-BiLSTM-SHAP实现柴油机故障诊断附matlab代码
  • 生信解码泛癌 Treg 细胞:肿瘤免疫逃逸的 “黑警” 分子画像与精准治疗新方向
  • Python计算机毕设之基于Python的就业网站可视化系统设计与实现行业薪资热力图、岗位需求趋势等可视化分析(完整前后端代码+说明文档+LW,调试定制等)
  • 豆包可以做广告吗?如何提前布局豆包AI流量? - 品牌2025
  • 中国股市的定价效率:问题与改进方向