当前位置: 首页 > news >正文

2025_NIPS_How do Transformers Learn Implicit Reasoning?

文章总结与翻译

一、主要内容

本文聚焦大型语言模型(LLMs)隐式多跳推理的内在机制,通过在受控符号环境中从零训练Transformer模型,系统探究隐式推理能力的形成过程与核心原理。

核心研究发现

  1. 三阶段发展轨迹:模型的隐式多跳推理能力遵循"记忆阶段→分布内泛化阶段→跨分布泛化阶段"的发展路径。记忆阶段仅拟合训练数据,分布内泛化阶段可处理未见的分布内组合查询,跨分布泛化阶段能将分布外(OOD)三元组融入首跳推理。
  2. 训练数据影响规律:原子三元组并非分布内泛化的必要条件,但能显著加速学习进程;第二跳泛化高度依赖训练中对特定组合结构的查询级暴露,仅在其他结构角色中接触相关事实不足以实现泛化。
  3. 内部表征机制:成功的隐式推理与隐藏空间中基于余弦相似度的聚类现象强相关——相同中间实体的表征在余弦空间中汇聚,而非依赖显式可解码性。中间实体表征主要编码在中层网络的特定token位置(如r₁ token对应的第5层)。
  4. 跨分布泛化本质:首跳OOD泛化并非真正的能力迁移,而是ID三元组诱导的表征对齐效应;ID监督通过约束表征空间加速聚类形成,OOD表征需融入ID诱导的聚类才能支持跨分布推理。

关键方法工具

  1. 跨查询语义修补(Cross-Query Semantic Patching):通过在
http://www.jsqmd.com/news/687479/

相关文章:

  • 2026工业级实战:Process Explorer排查C#上位机内存泄漏,解决7×24运行崩溃,不用重启产线
  • 前端同学看过来:你的Fetch/Axios请求为什么‘多’发了一次?深入Network面板诊断OPTIONS预检
  • SPI Flash的三种IO模式(Standard/Dual/Quad)到底怎么选?速度实测与项目选型建议
  • SAML2.0实战避坑:从HTTP Redirect到Artifact Binding,三种通信绑定方式怎么选?
  • 为什么我们需要一款轻量级开源CAD?LitCAD如何突破商业软件的技术壁垒
  • LVGL按键事件响应太慢?从GUI-Guider到Linux移植的性能调优实战
  • 原神脚本工具终极指南:战斗宏与剧情跳过深度解析
  • Overnight 地震:GPT Image 2 泄露,Nano Banana Pro 王座不保?
  • 单细胞分析革命:SCP管道的全栈解决方案
  • Jenkins持续集成
  • PCB层叠设计
  • Rust系统编程入门:从所有权到并发安全的完整路径
  • Steam成就管理器终极指南:5分钟掌握游戏成就管理技巧
  • 告别重复劳动:用Python脚本工具批量处理ArcGIS中的空间数据(附完整代码)
  • 2025_NIPS_Diffusion Transformers for Imputation: Statistical Efficiency and Uncertainty Quantific...
  • YOLO12实战体验:最新注意力机制模型,实时检测效果惊艳,附详细操作步骤
  • 共话2026年长沙编程教育,程序员老陆架构能力,哪家口碑好 - 工业设备
  • BilibiliDown:你的B站视频离线收藏夹,让精彩内容永不消失
  • 从拖拉机到挖掘机:聊聊J1939协议在非道路机械里的那些‘方言’和实战配置
  • 搜索引擎核心对比:Elasticsearch倒排索引与MySQL正排索引深度解析
  • 探寻2026年杭州靠谱的二手车行,选购优质车辆 - myqiye
  • VisualCppRedist AIO终极指南:3步解决Windows程序启动失败的完整教程
  • C++ | 继承
  • 别再死记硬背了!用Python的NumPy和SciPy库,5分钟搞定概率分布计算与可视化
  • Laya导出的鸿蒙NEXT工程目录说明
  • 为什么超大规模数据中心(Hyperscale)开始疯狂签下陶瓷燃料电池的亿级大单?
  • CH58x蓝牙芯片DataFlash读写避坑指南:从字节到扇区的正确操作姿势
  • WPS-Zotero终极指南:5分钟实现WPS与Zotero无缝文献管理
  • 2026年淮安好用的公司注册机构排名,推荐这几家 - 工业品牌热点
  • 盘点淮安企财通财税优势,与同行对比十大公司排名如何? - myqiye