当前位置: 首页 > news >正文

专家系统:装在盒子里的专家

先讲一个故事。

1970年代,美国斯坦福大学。

一个年轻的医学生,

走进了爱德华·费根鲍姆教授的办公室。

他说:

"教授,我有一个想法。

世界上最好的医生,只有那么几个。

但生病的人,有几十亿。

如果我们能把最好的医生的知识,

装进一台计算机,

让每一个人,都能享受到顶级医疗,

那会怎样?"

费根鲍姆教授,

放下手里的咖啡,

看着这个年轻人,

沉默了很久。

然后说:

“这,是一个值得用一生去追求的想法。”

于是,他们,

开始了一段改变人工智能历史的旅程。

这段旅程的产物,

叫做专家系统


什么是专家系统

一个简单的比喻

想象一下。

你家附近,有一个老中医。

他行医五十年,

见过无数的病人,

积累了丰富的经验。

他,能通过望闻问切,

判断你的病情,

给出治疗方案。

但他,只有一个人。

每天,只能看几十个病人。

而且,他终有一天,会老去,会离开。

他的知识,

会随着他的离开,

消失在时间里。

专家系统,就是试图把这个老中医的知识,

装进一台计算机里。

让计算机,

像老中医一样,

能够诊断疾病,给出建议。

而且,这台计算机,

可以复制无数份,

让全世界每一个角落的人,

都能享受到这位老中医的智慧。

正式的定义

专家系统,

是一种人工智能程序,

它,模拟人类专家的决策能力,

在特定的专业领域,

解决复杂的问题。

专家系统,有两个核心组成部分:

知识库(Knowledge Base):

存储专家的知识。

包括事实、规则、经验。

推理引擎(Inference Engine):

根据知识库里的知识,

对新的问题,进行推理,

得出结论。

专家系统的工作流程: 用户输入问题 ↓ 推理引擎,从知识库里, 检索相关的知识 ↓ 根据知识,进行推理 ↓ 得出结论 ↓ 向用户解释结论

专家系统的诞生:DENDRAL

1965年,第一个专家系统

1965年,

费根鲍姆和他的团队,

在斯坦福大学,

开发了人类历史上,

第一个专家系统:

DENDRAL

DENDRAL,是一个化学专家系统。

它,能根据质谱仪的数据,

推断出有机化合物的分子结构。

这,是一个极其复杂的任务。

即使是经验丰富的化学家,

也需要花费大量的时间,

才能完成这个分析。

DENDRAL,能在几秒钟内,

给出答案。

而且,它的答案,

和顶级化学家的答案,

几乎一样准确。

这,震惊了整个科学界。

DENDRAL 是怎么工作的

DENDRAL 的工作原理,

可以用一个简单的例子来说明。

输入:质谱仪数据 (一系列数字,代表分子碎片的质量) 知识库里的规则: 规则1:如果质量差为14,可能有CH₂基团。 规则2:如果质量差为28,可能有CO基团。 规则3:如果质量差为44,可能有CO₂基团。 ...(数百条规则) 推理过程: 1. 分析质谱数据,找出质量差。 2. 根据规则,推断可能的基团。 3. 组合基团,生成可能的分子结构。 4. 验证每个可能的结构,是否符合所有数据。 5. 输出最可能的分子结构。 输出:有机化合物的分子结构

DENDRAL,

把化学专家的知识,

编码成了一条一条的规则,

然后,用这些规则,

对新的数据,进行推理。


专家系统的黄金时代:MYCIN

1970年代,最著名的专家系统

如果说 DENDRAL,

是专家系统的开山之作,

那么,MYCIN

就是专家系统的巅峰之作。

MYCIN,是一个医疗诊断专家系统。

它,能诊断血液感染疾病,

并推荐抗生素治疗方案。

MYCIN 的知识库

MYCIN 的知识库,

包含了大约600条规则

这些规则,

是研究者们,

花了数年时间,

从顶级传染病专家那里,

一条一条地提取出来的。

MYCIN 的规则示例: 规则1: 如果: 感染的类型是菌血症, 并且,患者是免疫缺陷的, 并且,感染的来源是胃肠道, 那么: 有0.7的概率,致病菌是大肠杆菌。 规则2: 如果: 革兰氏染色结果是阳性, 并且,细菌形态是球菌, 并且,细菌排列是链状, 那么: 有0.8的概率,致病菌是链球菌。 规则3: 如果: 致病菌可能是大肠杆菌, 并且,患者对青霉素不过敏, 那么: 推荐使用氨苄西林治疗。

MYCIN 的推理过程

MYCIN,用一种叫做**反向链接(Backward Chaining)**的推理方式。

目标:确定治疗方案 推理过程: 要确定治疗方案, 需要先确定致病菌。 要确定致病菌, 需要先了解患者的症状和检查结果。 MYCIN 向医生提问: "患者的体温是多少?" "革兰氏染色结果是什么?" "患者是否有免疫缺陷?" ... 根据医生的回答, MYCIN 逐步缩小可能的致病菌范围, 最终,确定最可能的致病菌, 并推荐相应的治疗方案。

MYCIN 的惊人表现

1979年,

斯坦福大学,

做了一个著名的测试。

他们,让 MYCIN,

和10位人类医生,

对同样的10个病例,

进行诊断和治疗推荐。

然后,让8位顶级传染病专家,

对所有的诊断结果,

进行盲评。

结果:

MYCIN 的正确率:65% 人类医生的正确率: 最好的医生:62.5% 平均水平:42.5% 最差的医生:30%

MYCIN,超过了所有的人类医生。

这个结果,

震惊了整个医学界和人工智能界。

一台计算机,

在医疗诊断上,

超过了人类专家。

这,是人工智能历史上,

最重要的里程碑之一。


专家系统的工作原理:深入解析

知识获取:最难的一步

建立专家系统,

最难的一步,

不是编程,

而是知识获取

知识获取的过程: 知识工程师,和领域专家, 进行大量的访谈。 知识工程师问: "当你看到这种症状,你会怎么想?" "你是怎么做出这个判断的?" "有没有例外情况?" 领域专家回答: "嗯,这种情况,我通常会先考虑……" "如果同时出现A和B,那么……" "但如果患者有C的病史,就要另当别论……" 知识工程师, 把这些模糊的、口语化的知识, 转化成精确的、形式化的规则。

这个过程,

极其耗时,极其困难。

专家,往往无法清晰地表达,

自己是怎么做出判断的。

很多知识,是隐性的,

是"只可意会,不可言传"的。

把这些隐性知识,

转化成明确的规则,

是知识工程师,

最大的挑战。

推理引擎:知识的运用

推理引擎,

是专家系统的"大脑"。

它,根据知识库里的规则,

对新的问题,进行推理。

推理引擎,有两种主要的推理方式:

正向链接(Forward Chaining):

从已知的事实出发,

不断应用规则,

推导出新的事实,

直到得出结论。

已知:患者发烧,咳嗽,胸痛。 规则1:发烧 + 咳嗽 → 可能是呼吸道感染 规则2:呼吸道感染 + 胸痛 → 可能是肺炎 规则3:可能是肺炎 → 建议做胸部X光 推理过程: 发烧 + 咳嗽 → 可能是呼吸道感染(规则1) 呼吸道感染 + 胸痛 → 可能是肺炎(规则2) 可能是肺炎 → 建议做胸部X光(规则3) 结论:建议做胸部X光。

反向链接(Backward Chaining):

从目标结论出发,

反向推理,

找出需要满足的条件。

目标:确定是否是肺炎 需要满足的条件: - 有呼吸道感染的症状 - 有胸痛 检查条件1:有呼吸道感染的症状? 需要:发烧 + 咳嗽 检查:患者有发烧吗?→ 是 检查:患者有咳嗽吗?→ 是 结论:有呼吸道感染的症状。 检查条件2:有胸痛? 检查:患者有胸痛吗?→ 是 结论:有胸痛。 最终结论:可能是肺炎。

不确定性处理:现实世界的复杂性

现实世界,充满了不确定性。

医学诊断,不是非黑即白的。

专家系统,需要处理这种不确定性。

MYCIN,用了一种叫做**可信度因子(Certainty Factor)**的方法。

可信度因子,范围从-1到1: 1:完全确定是真的 0:完全不确定 -1:完全确定是假的 规则示例: 如果:革兰氏染色阳性(可信度0.8) 那么:致病菌是链球菌(可信度0.6) 计算: 结论的可信度 = 0.8 × 0.6 = 0.48 意思是: 有48%的可信度,致病菌是链球菌。

这种方法,

让专家系统,

能够处理不确定的信息,

给出带有置信度的结论。


专家系统的辉煌:商业应用

1980年代,专家系统的黄金时代

1980年代,

专家系统,

迎来了它的黄金时代。

几乎每一个大型企业,

都在开发自己的专家系统。

XCON:数字设备公司的专家系统

数字设备公司(DEC),

开发了一个叫做 XCON 的专家系统。

它,能根据客户的需求,

自动配置计算机系统。

XCON 的工作: 输入:客户的需求 "我需要一台能运行XX软件的计算机, 预算是XX美元, 需要XX的存储空间。" XCON 的推理: 根据需求,选择合适的CPU。 根据CPU,选择合适的主板。 根据主板,选择合适的内存。 根据软件需求,选择合适的存储设备。 ... 输出:完整的计算机配置方案

XCON,每年,

为 DEC 节省了大约4000万美元

这,是专家系统,

最成功的商业应用之一。

地质勘探专家系统

石油公司,

开发了地质勘探专家系统。

它,能根据地质数据,

预测石油和天然气的储量。

金融风险评估专家系统

银行,

开发了金融风险评估专家系统。

它,能根据客户的财务数据,

评估贷款风险。


专家系统的局限性:冬天来了

知识获取的瓶颈

专家系统,

有一个根本性的问题:

知识获取,太难了。

建立一个医疗专家系统, 需要: 数年的时间, 大量的知识工程师, 无数次的专家访谈, 反复的测试和修正。 而且,医学知识,在不断更新。 今天正确的规则, 明天可能就过时了。 维护一个专家系统, 和建立它,一样困难。

规则的脆弱性

专家系统,

只能处理,

知识库里有规则的情况。

遇到规则覆盖不到的情况,

它,就不知道怎么办了。

MYCIN 的规则, 覆盖了常见的血液感染疾病。 但如果遇到一种罕见的、 规则库里没有的疾病, MYCIN,就束手无策了。 它,不能像人类医生那样, 举一反三, 从已有的知识里, 推断出新的情况。

无法学习

专家系统,

不能从经验中学习。

它,只能使用,

人工编写的规则。

一个人类医生, 每看一个病人, 都在积累经验, 都在更新自己的知识。 专家系统, 看了一万个病人, 还是和最初一样, 不会有任何进步。 除非,知识工程师, 手动更新规则库。

常识的缺失

专家系统,

只有专业知识,

没有常识。

一个医疗专家系统, 可能知道所有的药物相互作用, 但不知道, "患者说他对某种药物过敏, 但他可能记错了药名" 这种常识性的情况。 人类医生, 会根据常识, 进一步询问和确认。 专家系统, 不会。

1980年代末,AI 寒冬

由于这些局限性,

专家系统,

逐渐失去了人们的信任。

维护成本越来越高,

能力提升越来越慢。

1980年代末,

人工智能,

进入了第二次寒冬。

专家系统,

从辉煌,走向了沉寂。


专家系统的遗产:它留下了什么

思想的遗产

专家系统,

虽然失败了,

但它,留下了宝贵的遗产。

它证明了,知识,是人工智能的核心。

没有知识,

机器,无法做出智能的决策。

这个思想,

影响了后来所有的人工智能研究。

它开创了知识工程这个领域。

如何获取知识,

如何表示知识,

如何使用知识,

这些问题,

至今仍然是人工智能研究的核心。

技术的遗产

专家系统,

留下了很多有用的技术。

规则引擎:

很多现代软件,

仍然使用规则引擎,

来处理业务逻辑。

银行的风控系统: 如果:交易金额 > 10万元 并且:交易地点在境外 并且:过去24小时内,有3次以上失败的交易 那么:标记为可疑交易,需要人工审核。

决策树:

专家系统里的推理逻辑,

演变成了机器学习里的决策树算法。

知识图谱:

专家系统的知识库,

演变成了现代的知识图谱。

谷歌的知识图谱,

百度的知识图谱,

都是专家系统思想的延伸。

专家系统,今天还在用吗

答案是:在用,但换了一种形式。

现代的专家系统, 不再叫"专家系统", 而是叫: - 规则引擎 - 决策支持系统 - 智能推荐系统 - 风险评估系统 它们,仍然在: 银行的贷款审批里, 医院的辅助诊断里, 电商的商品推荐里, 保险的理赔评估里, 默默地工作着。

专家系统 vs ChatGPT:一场跨越时代的对比

专家系统,和 ChatGPT,

代表了人工智能的两种截然不同的思路。

专家系统: 知识来源:人工编写的规则 推理方式:符号推理,逻辑清晰 可解释性:高,能解释每一步推理 适用范围:特定的专业领域 学习能力:无,不能自动学习 常识能力:弱,只有专业知识 ChatGPT: 知识来源:从海量文本中自动学习 推理方式:神经网络,过程不透明 可解释性:低,无法解释推理过程 适用范围:几乎所有领域 学习能力:强,从数据中自动学习 常识能力:强,有丰富的常识

专家系统,

像一个只懂一个领域的专家,

但在这个领域里,

逻辑清晰,有据可查。

ChatGPT,

像一个博览群书的通才,

什么都懂一点,

但有时候,会说错话,

而且,说不清楚自己为什么这么说。

两者,各有优劣。

未来,可能是两者的结合。


最后说一句

回到开头的故事。

那个年轻的医学生,

和费根鲍姆教授,

他们的梦想,

是把最好的医生的知识,

装进一台计算机,

让每一个人,都能享受到顶级医疗。

他们,做到了吗?

部分做到了。

MYCIN,确实超过了大多数人类医生。

但它,最终,

没有被用于临床。

因为,医学,太复杂了。

规则,永远无法覆盖所有的情况。

但他们的梦想,

没有消失。

它,传递给了下一代研究者,

下下一代研究者。

直到今天,

ChatGPT,

能够回答医学问题,

能够辅助医生诊断,

能够为普通人,

提供医疗建议。

这,不正是,

那个年轻医学生的梦想吗?

专家系统,失败了。

但它的梦想,

以另一种形式,

活了下来。

这,也许,

就是科学进步的方式。

不是一帆风顺,

而是,

在失败里,

找到前进的方向。

http://www.jsqmd.com/news/825338/

相关文章:

  • RK3588旗舰SoC驱动OpenHarmony标准系统开发实战
  • COMET神经网络翻译质量评估框架:多任务架构解析与多语言质量预测实现
  • Taotoken模型广场如何帮助开发者根据任务选择性价比最优模型
  • 基于SpringAI开发的通用RAG脚手框架,适配各种场景
  • 深度解析:HTTPS CDN 加速——告别“安全慢”的刻板印象
  • 如何选择2026年5月新发布的西南小羊皮艺术漆供应厂家?欧兰泥深度解析 - 2026年企业推荐榜
  • 重庆黔江区高新技术企业认定分批次申报时间及自查避坑指南
  • [特殊字符] CSS 图片变黑变暗的 3 种方案,总有一款适合你!
  • 手把手教你用PyTorch复现SSVEPNet:从脑电数据预处理到模型训练全流程(附代码)
  • 赋能东盟产业发展 广西职教出海打造跨境人才合作新样板
  • 基于CRICKIT与CPX的交互式电子展板:从传感器到执行器的完整原型开发指南
  • Adobe MAX 2024未公开彩蛋:Sora 2本地推理模块如何通过Premiere Ultra引擎实现离线实时预览(含CUDA核心绑定指南)
  • 收敛性的实际意义:算法世界里的“靠谱“二字
  • Endowment Effect
  • DeepSeek GitOps从零到稳:7步完成K8s集群自动化部署,附可复用的Helm+ArgoCD配置清单
  • 如何评估拓客数据的有效性?避开无效内耗,精准提效
  • 告别抢票焦虑:3步配置Python自动化脚本轻松抢到演唱会门票
  • 【LLM引用可信革命】:Perplexity底层引用追踪机制逆向解析与企业级加固方案
  • 从零部署ChatGPT Discord机器人:架构解析与实战指南
  • 3天掌握Obsidian Tasks:从零到高效任务管理的终极指南
  • Fast-DDS Benchmark 参考结果与验收目标
  • 快速上手Redis
  • Newhaven 5.0英寸TFT显示屏技术解析与应用指南
  • 终极免费暗黑破坏神2存档编辑器:d2s-editor完全使用指南
  • Arduino开源贡献全流程:从Fork到Pull Request的工程实践
  • 【限时解密】DeepSeek官方未公开的MATH测试阈值数据:仅Top 3.8%模型通过CoT一致性压力测试
  • Arm Neoverse CMN-650架构解析与系统地址映射实践
  • 人工智能【第29篇】AI前沿技术展望:多模态学习、Agent与AGI
  • 互联网大厂 Java 求职面试:从 Spring Boot 到微服务与云原生的技术探讨
  • 智能体协作框架call-agents-help:构建多AI模块协同系统的工程实践