当前位置：首页 > news >正文

2025_NIPS_The Transient Nature of Emergent In-Context Learning in Transformers

news 2026/5/28 9:16:20

文章核心总结与翻译

一、主要内容

该研究聚焦Transformer模型中上下文学习（ICL）的特性，核心发现是ICL具有暂时性：在训练过程中，ICL会先出现，随后在训练损失持续下降的情况下逐渐消失，被权重内学习（IWL）取代。

实验设计：构建基于Omniglot图像数据集和LLaMa语言模型token嵌入的合成数据集，设计支持ICL和IWL两种策略的训练任务，通过专属评估序列分别度量两种学习模式的性能。
关键发现：
- ICL的暂时性在不同模型规模（深度、宽度）、数据集大小（类别数、类内样本数）和数据类型（图像、语言token嵌入）中均存在；
- 数据分布特性（如Zipfian偏斜分布、高类别数）可延缓ICL衰退，但无法彻底消除；
- L2正则化能有效抑制ICL暂时性，甚至实现ICL的持续存在，而过强正则化会导致模型性能退化；
- ICL暂时性的核心原因是ICL与IWL电路在Transformer残差流中存在资源竞争，IWL在渐近训练中更受青睐。
实践启示：过度训练可能导致模型丢失ICL能力，需通过早期停止或正则化平衡ICL与IWL，小型模型优化需重视这一现象。

二、创新点

首次揭示ICL的暂时性本质，挑战了“ICL一旦出现便会

http://www.jsqmd.com/news/902225/

相关文章：

商丘市黄金回收白银回收铂金回收彩金回收门店优选+2026年最新黄金回收TOP5排行榜及联系方式 - 亦辰小黄鸭

[STM32 HAL库]学习笔记，七、定时器

看舌头APP重大更新：四步AI问诊上线，免费中医大模型能否颠覆传统辨证？

天赐范式第56天：长春一场雨——顿悟方腔流“下雨法”——增加扰动，验证收敛

海东市黄金回收白银回收铂金回收彩金回收门店优选+2026年最新黄金回收TOP5排行榜及联系方式 - 亦辰小黄鸭

VGA模型：基于三维几何表征的机器人视觉动作映射新范式

AI-HF_Patch完全指南：3个核心功能如何让你的AI少女游戏体验提升200%？

异构集成技术解析：从Chiplet到3D封装，突破芯片性能瓶颈

2026最新漯河市黄金回收白银回收铂金回收店铺实力口碑排行榜TOP5；K金+金条+银条+首饰回收靠谱门店及联系方式推荐 - 前途无量YY

硬件老鸟的ADS前仿真私房菜：如何用4port S参数模板为你的PCB设计“探路”？

解决Keil MDK中ULINK2调试器跨版本兼容性问题

5步快速上手猫抓浏览器扩展：视频资源捕获的终极指南

为什么你的 absolute总是乱跑？聊聊 Relative、Absolute 和 Fixed 的爱恨情仇

海口市黄金回收白银回收铂金回收彩金回收门店优选+2026年最新黄金回收TOP5排行榜及联系方式 - 亦辰小黄鸭

SAP APO老兵实战笔记：从DP、SNP到PPDS，手把手教你理解S4HANA的升级路径与核心差异

2026最新吕梁市黄金回收白银回收铂金回收店铺实力口碑排行榜TOP5；K金+金条+银条+首饰回收靠谱门店及联系方式推荐 - 前途无量YY

跟着经典教材《Robotics, Vision and Control》复现案例？手把手教你配置RTB 9.10+MATLAB环境

从Wi-Fi信号到手机充电：用大白话聊聊麦克斯韦方程组到底在说啥

2026年工程合同管理软件，好用推荐

【教学类-134-02】20260524 Python制作童话故事音频02——筛选所有能用的edge-tts中文高质量语音合成语音库（TTS）

AI矩阵联动短剧创作：一键分发全网，流量全域覆盖实战攻略

建筑领域“建筑结构智能设计”高价值专利案例：一种剪力墙结构生成式设计方法

别再手动摆路啦！用Houdini 18.5 + UE4.25 程序化生成城市道路（附HDA资产）

大学生为什么要学 OPC？抓住 AI 时代就业创业红利

Java抽象类和接口

海林市黄金回收白银回收铂金回收彩金回收门店优选+2026年最新黄金回收TOP5排行榜及联系方式 - 亦辰小黄鸭

2026最新马鞍山市黄金回收白银回收铂金回收店铺实力口碑排行榜TOP5；K金+金条+银条+首饰回收靠谱门店及联系方式推荐 - 前途无量YY

XOOER 数尔解读：生态五大 GEO 服务依托健康、安全、合规、元生、打造全新 AI 增长生态

基于ML .NET与WebsiteAIAssistant构建网站智能分类助手

LangChain 实践3 5无Function Call的结构化通用Agent 6Function Call 智能工具助手