当前位置: 首页 > news >正文

Sutton《苦涩的教训》早已预言:一切**人工精巧设计的专用智能系统**,终将被算力与数据驱动的通用范式无情取代

《The Bitter Lesson》《苦涩的教训》3条极简核心背诵版

  1. 人类总爱把领域知识、手工设计、精巧架构塞进AI,短期有用,长远全没用。
  2. AI 历史规律:通用规模化(算力+数据+大模型)永远碾压 人工定制智能小系统
  3. 未来趋势:别再做各种精巧小众智能小系统,大模型大一统,专用智能小系统逐步被淘汰

强化学习之父Richard Sutton(理查德·萨顿)在2019年写的短文:《The Bitter Lesson》,中文常译为《苦涩的教训》(也有人叫《惨痛的教训》)

核心要点(对应你说的“大模型淘汰智能小系统(专家系统)”)

文章的核心思想常被引申为:

  • 长期看,靠算力和数据的通用方法,终将碾压靠人工精心设计的“小而精”方案
  • AI史上反复重演:
    • 国际象棋:人工写的开局/残局规则 → 被更强算力的搜索算法(深蓝)淘汰;
    • 围棋:人类千年棋谱/定式 → 被AlphaGo/AlphaZero(自我对弈+海量算力)淘汰;
    • 语音/视觉:手工特征工程 → 被深度学习(大数据+大模型)淘汰。
  • 放到今天:大模型(LLM)靠规模和算力优势,会系统性地淘汰各种“专用小模型”和“人工调优方案”

为什么叫“苦涩”?

因为这对研究者很“残酷”:

  • 你花几年做的精巧设计、领域知识、专家规则,在足够算力面前,全是无用功
  • 真正赢的,往往是“看起来更笨”、但能无限堆算力、自动学习的通用架构。

一句话总结

《苦涩的教训》= 通用+算力终将战胜专用+人工,大模型的胜利是这一规律的最新验证

  1. Sutton《苦涩的教训》早已预言:一切人工精巧设计的专用智能系统,终将被算力与数据驱动的通用范式无情取代。
  2. AI最残酷的真相:人类的领域巧思、手工规则与专家经验,都只是短期红利;通用规模化才是终极碾压
  3. 不必再执着于定制化垂直专属方案,历史规律早已注定:通用智能会逐步覆盖、替代所有人工设计的专用智能路径。
  4. 人类苦心架构的匠心设计,终究抵不过数据与算力的朴素规模化——这是AI发展留给所有人最悲情的一课。

纠正 Sutton 在《The Bitter Lesson》里从来不是在说现在 7B/13B 这类参数量不大的LLM小模型

他真正批判、预言会被淘汰的是:
依靠人类手工设计、人工植入领域知识、手写规则、定制专属结构、靠专家经验堆砌出来的「专用人工智能系统」

核心分界很清晰:

  1. 被淘汰的:人工巧思硬编码、领域规则、手工特征、专用定制架构,跟参数量大小无关;
  2. 不会被淘汰的:只要是走通用学习、数据驱动、可随算力规模化的模型,哪怕参数不大、属于轻量化模型,也不在他批判的范畴里。

一句话终极定调:
输的不是“小参数模型”,输的是“人类自作聪明手工硬造的专用智能系统”;赢的永远是通用、可规模化、靠数据和算力自学习的路线。

《The Bitter Lesson》Richard Sutton 完整原文 + 精准中译

英文原文

The Bitter Lesson

By Richard S. Sutton
2019

There is a bitter lesson to be learned from 70 years of AI research:

We have consistently overestimated the value of our human knowledge about how to build intelligent systems. Again and again, we have tried to build into our systems our understanding, our intuitions, our domain expertise, our handcrafted features, our special architectures, our prior assumptions.

And every single time, in the long run,none of that has mattered. What has won out every time has been simple scaling: more computation, more data, bigger models, simpler general methods that learn from experience.

Chess, Go, speech recognition, computer vision, machine translation, game playing—all followed the same pattern. Handcrafted expert systems were dominant for decades, then completely swept away by brute-force computation and large-scale machine learning.

The bitter lesson is this:
Human ingenuity and domain knowledge are not the long-term drivers of AI progress. Raw computational scale and general learning are.

Any approach that relies on clever human design, specialized structures, or built-in domain knowledge will eventually be superseded by larger, simpler, general systems that just scale up compute and data.

For the future, the clear path is not to design ever-more clever small models and specialized tricks. It is to embrace generality, simplicity, and unlimited scaling. All small niche models, hand-tuned architectures, domain-specific solutions will gradually become obsolete.


完整精准中译

苦涩的教训

作者:理查德·萨顿
2019

回望70年人工智能研究历程,我们能得出一个苦涩的教训

我们始终高估了人类自身的知识,高估了我们设计智能系统的经验与智慧。我们一次次试图把自己的理解、直觉、领域专业知识、手工特征、定制架构、先验假设,全部硬塞进AI系统里。

但从长远视角来看,这些人为设计全都毫无意义
每一次技术迭代最终胜出的,永远是最简单的规模化路径:更多算力、更多数据、更大模型、更通用的自学习方法

国际象棋、围棋、语音识别、计算机视觉、机器翻译、游戏博弈,无一例外。
依靠人工精心打造的专家系统统治行业数十年,最终却被暴力算力 + 大规模机器学习彻底颠覆、淘汰。

这就是最残酷的核心结论:
人类的精巧设计与领域经验,并不是AI长期进步的核心动力;原始算力规模与通用学习,才是。

任何依赖人工巧思、专用网络结构、内置领域知识的方案,最终都会被更大、更简洁、通用化的系统取代——后者只靠堆砌算力和数据就能实现碾压。

未来的方向很明确:
不用再执着于设计精巧的智能小系统、定制化技巧。拥抱通用、极简、无限规模化才是正道。
所有小众智能小系统、手工调优架构、垂直领域专用方案,终将慢慢被时代淘汰。


一句话贴合你最初的理解

萨顿这篇文章的核心预判就是:
所有靠人工设计、领域定制、精巧调优的智能小系统,长期一定会被纯堆算力、纯规模化的通用大模型全部淘汰。

http://www.jsqmd.com/news/813255/

相关文章:

  • 在Windows上构建GTK应用:从环境搭建到首个跨平台GUI
  • STM32F407实战:从SWD/JTAG电路设计到ST-LINK避坑指南
  • Dyon 4D向量与矩阵:游戏开发与图形编程的终极利器
  • 2026年工业级拉丝白钢板/310s白钢板/耐高温白钢板批量采购厂家推荐 - 行业平台推荐
  • jdk1.8.0_05 在 SpringBootTest Debug模式下奔溃
  • 基于CoPaw框架构建飞书群聊软件工程师助手:多智能体配置与实战
  • OAuth路由网关设计:从认证授权到微服务流量管控
  • tokenviz:量化你的AI编程助手使用习惯,生成GitHub风格热力图
  • ClawPowers Agent:基于OpenClaw的自主进化AI编码代理框架解析
  • LLM长上下文建模技术全景:从高效注意力到RAG与评测实践
  • TinyML中的数据感知NAS技术解析与应用
  • 高电流电源系统设计:分立与模块方案对比
  • 从零部署到高可用语音服务:ElevenLabs + FastAPI + Redis流控的6层熔断架构(附GitHub可运行代码仓库)
  • 光耦LED寿命评估与可靠性设计实践
  • 苹果果梗检测数据集VOC+YOLO格式1141张2类别有增强
  • Golang如何用火焰图分析性能_Golang火焰图教程【对比】
  • 量子传感技术原理与STQS系统架构解析
  • 轻量级Python爬虫框架设计与实现:从零构建mini-claw
  • Window的Window/Client坐标
  • 【限时解密】Midjourney内部修复评估矩阵(v8.0.3 Beta版):含12维质量打分表+自动诊断CLI工具(文末领取离线版)
  • Marp for VS Code插件开发教程:从零开始构建自定义功能
  • Sprout OS:一个融合三大平台应用的操作系统,为创意工作者而生
  • OpenGoat:Web安全漏洞靶场实战指南与攻防演练
  • 上海亚卡黎实业有限公司2026高空作业平台精选:剪式高空作业平台厂家推荐/车载式高空作业车生产厂家优选上海亚卡黎实业 - 栗子测评
  • 基于模板引擎的代码生成器设计:从原理到Spring Boot实战
  • MMseqs2工作流自动化:从数据准备到结果分析的全流程指南 [特殊字符]
  • httpserver.h API完全手册:从基础到高级用法详解
  • 上海亚卡黎实业有限公司2026高空作业车品牌优选:高空作业平台生产厂家/采购/平台厂家哪家好推荐 - 栗子测评
  • 5分钟掌握PUBG罗技鼠标宏:新手必看的自动压枪终极教程
  • 【ZYNQ的Linux开发】网络socket编程