当前位置：首页 > news >正文

Large Language Models as Model Organisms for Human Associative Learning

news 2026/7/4 4:52:23

文章核心总结与翻译

一、主要内容

本文将大型语言模型（LLMs）作为人类联想学习的计算模型，通过适配认知神经科学的联想学习范式，探究6个开源LLM在上下文学习（ICL）中的表征动态变化。核心发现包括：LLM的表征变化符合非单调可塑性假说（NMPH），仅在学习巩固阶段呈现U型曲线（中等相似的token对会分化）；提出“词汇干扰”概念，即新联想与模型先验知识的竞争会调节表征变化，干扰越强分化越明显；LLM的学习过程分为编码、巩固、遗忘三阶段，且不同模型的遗忘机制存在差异。

二、创新点

首次将LLM作为“模型有机体”用于人类联想学习研究，解决了生物系统中难以控制变量、采样密集度不足的实验难题。
验证了NMPH在LLM中的适用性，发现该非单调模式仅存在于巩固阶段，揭示了学习阶段与表征变化的关联。
提出“词汇干扰”这一可量化的新因素，阐明局部token相似性与全局词汇竞争对表征变化的联合影响。
系统划分LLM联想学习的三阶段动态，为理解模型记忆重组机制提供了新框架。

三、关键部分翻译（Markdown格式）

Abstract（摘要）

联想学习——即在共现项目间建立关联——是人类认知的基础，会以复杂方式重塑内部表征。在生物系统中测试表征变化如何发生的假说具有挑战性，但大型语言模型（LLMs）提供了一种可扩展的替代方案。基于LLMs的上下文学习能力，我们适配了一种认知神经

http://www.jsqmd.com/news/1119562/

相关文章：

文心5.0高分低能？真实业务场景下的能力压力测试报告

为什么真实AI工程实践选择GPT-4o而非‘新模型’

第五周学习记录

【Jetson】YOLOv8环境搭建与TensorRT加速部署

云数据库无法连通解决

用 Excel / Python 做快消补货周报：从销量、库存、在途生成动作清单

小学期第三周学习笔记

v4l2驱动框架——ctrl_handler

PCB阻抗设计实战：基于嘉立创480种叠层模板的4层板50Ω单端线宽计算

在 Simulink 中搭建一个基于 Cuk 拓扑的双向主动均衡电路，并实现精准的闭环控制。

Rockchip RK3576芯片架构与AIoT应用解析

5步掌握GmsCore：开源Play Services替代方案完全指南

AI 生成的文档如何导出？职场高效选 AI 导出鸭，多端适配轻松完成海量 AI 文档快速导出

Does Model Size Matter? A Comparison of Small and Large Language Models for Requirements Classifi...

小学期学习——第五周

小学期第一周学习笔记

OpenSpeedy终极指南：Windows游戏加速引擎的完整解析

2024服务器应急响应实战：病毒木马排查与安全加固全流程

UVa 532 Dungeon Master

C++学习：类和对象

Deepseek-V4 vs Claude-Opus：编程场景下的工程直觉与语义理解实战对比

游戏化编程学习：CodeCombat如何让你在冒险中掌握Python和JavaScript

5分钟快速部署Coraza WAF：开源、高性能的Web应用防火墙实战指南

品牌食品被指存在异物：三维协同证据体系构建

终极指南：3分钟学会用E-Hentai Downloader免费下载漫画档案 [特殊字符]

合同系统中关于合同文本的管理

AES加密图片全攻略：从原理到跨平台实战

Web安全核心攻击与防御：SQL注入、XSS、CSRF实战解析

NYC出租车数据分析终极指南：30亿行程数据的高效处理与智能分析

第三周学习记录