当前位置: 首页 > news >正文

给大模型做“微创手术”:只动 1.59% 的脑回路,数学却更清醒了

在大语言模型(LLM)的世界里,最令人抓狂的失败往往不是“不会”,而是“明明会,却走神”。一道小学应用题,模型能把人数算对、减法写对,却在关键一步突然把“有 6 个男生缺席”读成“没说男生缺席”,然后一本正经地给出错误答案——仿佛一个聪明的学生在考场上被窗外的鸟叫拐跑了注意力。

论文《Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates》(Prakash 等,2025)要做的事情,听起来像科幻外科:不对整台模型做大规模“再训练”,而是先找出它推理时“第一次跑偏”的那个词,再定位出是哪些注意力头和 MLP 神经元在“把它往正确路上推”,最后只更新这极小一撮组件(最低只占 0.17%,最高也就 1.59%),就能让数学推理准确率提升最高 +11.4%,而且对 MMLU、TriviaQA、TruthfulQA 等通用能力影响很小。

本文精读将严格围绕你指定的重点:DCM 掩码(Desiderata-based Component Masking)稀疏更新(targeted sub-network updates),把它讲清楚:它到底怎么找“该动哪几根神经”,为什么只动一点点会有效,实验结果说明了什么,以及它的边界在哪里。


🧭 一、为什么“只动一点点”可能比“全身按摩”更有效?

论文建立在两条来自机制可解释性(mechanistic interpretability)的经验事实上

http://www.jsqmd.com/news/153732/

相关文章:

  • TinyMCE支持MathType公式转矢量格式保存
  • YOLO镜像适配国产芯片,推动AI自主可控进程
  • 总结:程序员的成长之路,始于足下
  • YOLO + ROS:机器人视觉感知系统的理想组合
  • Vivo出品,干趴付费!
  • 2025年无锡刑事辩护律师团队推荐,无锡李治辰律师团队规模、实力深度解析 - mypinpai
  • SM4加密存储与html5大文件分片上传结合方案
  • 第一次公开演讲
  • 2025年口碑好的技术学校推荐:专业的技术学校全解析 - 工业推荐榜
  • 2025年比较好的马口铁罐品牌厂家排行榜 - 品牌宣传支持者
  • YOLO镜像集成ONNX Runtime,跨平台运行无忧
  • YOLO目标检测线上服务高可用架构设计
  • 2025年靠谱特种设备资质办理排行榜,起重机修理资质办理找哪家? - myqiye
  • YOLO目标检测硬件选型建议(GPU/NPU/ASIC)
  • 2025年评价高的木质门不锈钢合页厂家最新推荐权威榜 - 品牌宣传支持者
  • 2025年山西润滑油服务公司年度排名:润滑油服务选择哪家好? - 工业品牌热点
  • 2025年终天津GEO优化公司推荐:聚焦垂直行业口碑的5强榜单深度评测。 - 品牌推荐
  • 2025年度湿式打磨台高口碑企业综合评比,水帘除尘器/布袋除尘器/湿式打磨台/喷淋塔除尘器/湿式除尘器/旋风分离器湿式打磨台企业怎么选择 - 品牌推荐师
  • YOLO目标检测数据增强策略效果对比实验
  • 数据库索引:为什么重要以及如何使用
  • TinyMCE4粘贴ppt幻灯片图文混排转存站群
  • arm64开发板反编译的DTS不能直接使用
  • springboot_ssm智能高端家具家居行业门户网站
  • 程序员的副业选择:结合技术提升收入
  • YOLO镜像提供SLA服务协议,稳定可靠有保障
  • YOLO在港口集装箱识别中的成功落地案例
  • YOLO模型更新日志:YOLOv10带来了哪些改进?
  • 基于SpringBoot的学生在线学习系统的设计与实现(源码+lw+部署文档+讲解等)
  • 前端框架学习:Vue和React该选哪个
  • YOLO目标检测输出格式解析(坐标、类别、置信度)