当前位置: 首页 > news >正文

强化学习之父 Richard Sutton: 如今AI正进入“经验时代” - 指南

2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)在2025 Inclusion·外滩大会上发表主旨演讲,他认为,人类信息红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往。

萨顿表示,大多数机器学习的目标,是把人类已有的知识转移到静态、缺乏自主学习能力的AI 上。“大家逐渐达到人类数据的极限,现有的方法不能生成新的知识,不适合持续学习,而持续学习对智能的效用至关重要。”

他认为,我们正进入“经验时代”,需要一种新的数据源,由智能体与世界直接交互中生成。这正是人类和其他动物的学习方式,是AlphaGo自我博弈下的“第37手”,也是近期AlphaProof在国际数学奥林匹克斩获银牌的路径。

萨顿解释,“经验”指的是观察、行动和奖励,这三种信号在智能体与世界之间来回传递。“知识来自于经验,可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。”他同时指出,强化学习带领大家进入了新的经验时代,但要释放全部潜力,还需要两项目前尚不成熟的技术——持续学习(continual learning)和元学习(meta-learning)技术。

面对外界对AI带来偏见、失业甚至人类灭绝的担忧,萨顿认为,这种对人工智能的恐惧被夸大了,目标不同的智能体,可以通过去中心化的协作实现双赢。“人类最卓越的超能力,就在于比其他任何动物都更擅长协作。人类最伟大的成功在协作本身——经济、市场与政府都是成功协作的产物。”萨顿表示,人工智能和人类繁荣将来自于去中心化协作,“协作并非总能实现,却是世间一切美好事物的源泉,大家必须寻求协作、支持协作,并致力将协作制度化。”

他认为,在人类的发展进程中,人工智能的替代将是不可避免的。而人类至少是催化剂,是助产士,更是开启宇宙第四大时代——“设计时代”的先驱。萨顿将宇宙历史分为四个时代:粒子时代、恒星时代、复制者时代和设计时代。

“人工智能是宇宙演化的必然下一步,我们应以勇气、自豪和冒险精神来迎接它。”萨顿表示。

http://www.jsqmd.com/news/333/

相关文章:

  • Java 注解 - 实践
  • 安规对变压器的绝缘系统要求
  • 嵌入式笔记系列——UART:TTL-UART、RS-232、RS-422、RS-485 - 指南
  • 实用指南:医院高值耗材智能化管理路径分析(下)
  • Flutter应用自动更新系统:生产环境的挑战与解决方案
  • .NET Core中使用SignalR
  • Django + Vue3 前后端分离工艺实现自动化测试平台从零到有系列 <第一章> 之 注册登录完成
  • 实用指南:【保姆级教程】TEXTurePaper运行环境搭建与Stable Diffusion模型本地化
  • 实用指南:修复Conda连接异常:CondaHTTPError HTTP 000 CONNECTION FAILED故障排除指南
  • 高级数据结构手册
  • 3634501 - [CVE-2025-42944] Insecure Deserialization vulnerability in SAP Netweaver (RMI-P4)
  • 【无人艇协同】基于matlab面向海事安全的双体无人艇分布式协同任务规划(目标函数:总时间满意度)【含Matlab源码 14161期】博士论文 - 教程
  • 实用指南:Unity 打包 iOS,Xcode 构建并上传 App Store
  • 实用指南:GitHub 热榜项目 - 日榜(2025-09-09)
  • 深入解析:【Fiora深度解析】手把手教你用固定公网IP搭建专属聊天系统!
  • 使用JavaScript和CSS创建动态高亮导航栏
  • wxt 开发浏览器插件的框架
  • Gridspech 全通关
  • 1967
  • 20253320蒋丰任
  • 又有两位智驾大牛联手入局具身智能机器人赛道创业,已完成数亿元融资!
  • 纯国产GPU性能对比,谁才是国产算力之王?
  • 地平线明年发布并争取量产舱驾一体芯片;比亚迪补强智舱团队,斑马智行原 CTO 加入
  • 英伟达入股英特尔,当竞争对手便成协作者,真正受益的......
  • ODT/珂朵莉树 入门
  • 博客更新公告
  • 在AI技术快速实现功能的时代,挖掘新需求成为关键突破点——某知名游戏资源分析工具需求洞察
  • 蜜罐
  • 【光照】[漫反射]UnityURP兰伯特有光照衰减吗?
  • 手把手带你从零开始实现一个编译器