当前位置: 首页 > news >正文

Large Language Models as Model Organisms for Human Associative Learning

文章核心总结与翻译

一、主要内容

本文将大型语言模型(LLMs)作为人类联想学习的计算模型,通过适配认知神经科学的联想学习范式,探究6个开源LLM在上下文学习(ICL)中的表征动态变化。核心发现包括:LLM的表征变化符合非单调可塑性假说(NMPH),仅在学习巩固阶段呈现U型曲线(中等相似的token对会分化);提出“词汇干扰”概念,即新联想与模型先验知识的竞争会调节表征变化,干扰越强分化越明显;LLM的学习过程分为编码、巩固、遗忘三阶段,且不同模型的遗忘机制存在差异。

二、创新点

  1. 首次将LLM作为“模型有机体”用于人类联想学习研究,解决了生物系统中难以控制变量、采样密集度不足的实验难题。
  2. 验证了NMPH在LLM中的适用性,发现该非单调模式仅存在于巩固阶段,揭示了学习阶段与表征变化的关联。
  3. 提出“词汇干扰”这一可量化的新因素,阐明局部token相似性与全局词汇竞争对表征变化的联合影响。
  4. 系统划分LLM联想学习的三阶段动态,为理解模型记忆重组机制提供了新框架。

三、关键部分翻译(Markdown格式)

Abstract(摘要)

联想学习——即在共现项目间建立关联——是人类认知的基础,会以复杂方式重塑内部表征。在生物系统中测试表征变化如何发生的假说具有挑战性,但大型语言模型(LLMs)提供了一种可扩展的替代方案。基于LLMs的上下文学习能力,我们适配了一种认知神经

http://www.jsqmd.com/news/1119562/

相关文章:

  • 文心5.0高分低能?真实业务场景下的能力压力测试报告
  • 为什么真实AI工程实践选择GPT-4o而非‘新模型’
  • 第五周学习记录
  • 【Jetson】YOLOv8环境搭建与TensorRT加速部署
  • 云数据库无法连通解决
  • 用 Excel / Python 做快消补货周报:从销量、库存、在途生成动作清单
  • 小学期第三周学习笔记
  • v4l2驱动框架——ctrl_handler
  • PCB阻抗设计实战:基于嘉立创480种叠层模板的4层板50Ω单端线宽计算
  • 在 Simulink 中搭建一个基于 Cuk 拓扑的双向主动均衡电路,并实现精准的闭环控制。
  • Rockchip RK3576芯片架构与AIoT应用解析
  • 5步掌握GmsCore:开源Play Services替代方案完全指南
  • AI 生成的文档如何导出?职场高效选 AI 导出鸭,多端适配轻松完成海量 AI 文档快速导出
  • Does Model Size Matter? A Comparison of Small and Large Language Models for Requirements Classifi...
  • 小学期学习——第五周
  • 小学期第一周学习笔记
  • OpenSpeedy终极指南:Windows游戏加速引擎的完整解析
  • 2024服务器应急响应实战:病毒木马排查与安全加固全流程
  • UVa 532 Dungeon Master
  • C++学习:类和对象
  • Deepseek-V4 vs Claude-Opus:编程场景下的工程直觉与语义理解实战对比
  • 游戏化编程学习:CodeCombat如何让你在冒险中掌握Python和JavaScript
  • 5分钟快速部署Coraza WAF:开源、高性能的Web应用防火墙实战指南
  • 品牌食品被指存在异物:三维协同证据体系构建
  • 终极指南:3分钟学会用E-Hentai Downloader免费下载漫画档案 [特殊字符]
  • 合同系统中关于合同文本的管理
  • AES加密图片全攻略:从原理到跨平台实战
  • Web安全核心攻击与防御:SQL注入、XSS、CSRF实战解析
  • NYC出租车数据分析终极指南:30亿行程数据的高效处理与智能分析
  • 第三周学习记录