当前位置: 首页 > news >正文

论文归纳-影响函数在LLM中的应用

影响函数(Influence function)可以用来量化单个训练数据对模型参数的作用,进而对模型输出的影响。该影响可以是正面的,也可以是负面的。
影响函数常常用于训练数据归因(data attribution)、数据筛选、解释模型行为等领域。

之前的研究,例如ICML2017 best paper,对影响函数在MLP、CNN、RNN等模型的应用进行了探讨。但是将影响函数 scale 到大模型领域存在挑战:

  1. 模型参数巨大,逆海森向量积 (inverse-Hessian-vector product, IHVP)计算困难
  2. 训练数据庞大,对所有训练样本进行计算梯度相当于一次预训练

本文将对影响函数在大模型领域的现有研究进行总结。

影响函数的定义

  1. 影响函数通过梯度 × 逆海森矩阵,量化加入 / 删除一个训练样本会让模型输出改变多少。

    \[\theta_{\varepsilon, k}=\operatorname{arg} \operatorname*{min}_{\theta\in\Theta} \frac{1} {N} \sum_{i=1}^{N} \mathcal{L} ( z_{i} , \theta)+\varepsilon\mathcal{L} ( z_{k} , \theta) , \]

    • \(z_k\)为训练数据中的第k个样本,考虑对该样本进行上采样时模型参数的变化
  2. 该数据对模型参数\(\theta^*\)的影响,定义为\(\varepsilon=0\)处的导数

    \[\mathcal{I}_{\theta^*}(z_k) = \frac{d \theta_{\varepsilon, k}} {d \varepsilon} \Big|_{\varepsilon=0} = -H_{\theta^*}^{-1} \nabla_\theta \mathcal{L}(z_k; \theta^*) \]

    • \(H_{\theta^*}\)是损失函数的海森矩阵
    • \(\nabla_\theta \mathcal{L}(z_k; \theta^*)\)是样本\(z_k\)对模型参数的梯度
    • 我们假设损失函数是二阶可微,且是凸的。这样海森矩阵\(H_{\theta^*}\)才存在
    • 为了保证逆矩阵的存在,通常采用阻尼法,即\(H_{\theta^*} \leftarrow H_{\theta^*} + \lambda I\);或者可以采用进一步的proximal Bregman response function (PBRF)
  3. 训练样本\(z_k\)对测试样本\(z_{\text{test}}\)的影响:

    \[\mathcal{I}(z_{\text{test}}, z_k) = -\nabla_\theta \mathcal{L}(z_{\text{test}}; \theta^*)^\top H_{\theta^*}^{-1} \nabla_\theta \mathcal{L}(z_k; \theta^*) \]

    • 如果省去中间的\(H_{\theta^*}\),则退化为梯度匹配问题(也常被用于解释模型输出)

Studying Large Language Model Generalization with Influence Functions

arxiv 2023, Anthropic

Pretrained models

为了更好地理解机器学习模型并减少相关风险,研究者希望找出哪些训练样本对给定行为的贡献最大。影响函数旨在回答一个反事实问题:如果将给定序列添加到训练集中,模型的参数(及其输出)会如何变化?

  1. 针对IHVP的计算挑战,文章采用Eigenvalue-corrected Kronecker-Factored Approximate Curvature (EK-FAC)近似Hessian矩阵。在与影响函数精度相似的情况下,显著提升计算速度。
  2. 针对所有候选数据的梯度计算挑战,文章提出了两个方法:
    1. TF-IDF 过滤:使用TF-IDF进行打分,筛选出和query有一定重复token的、相关的top-k个数据。实验中采用的是BM25来实现TF-IDF.
    2. 查询批处理:通过存储预条件查询梯度的低阶近似,可以将数百个预条件查询梯度存储在内存中,从而允许我们在这些查询之间分担训练梯度计算的成本。

影响函数作为一个工具,使得研究者能够分析模型的泛化行为。文章中得到了以下几个发现:

  1. 影响力的分布是厚尾(heavy-tailed)的,影响力分布的尾部大致遵循幂定律。然而,这种影响是分散在许多序列上的,而不是集中在少数几个序列中,这表明典型的行为模式并不是直接记忆少数几个序列的结果。
  2. 影响大致均匀地分布在各层上。不同的层表现出不同的泛化模式,上层和下层更接近于tokens,而中间层侧重于更抽象的模式。
  3. 影响函数对语序很敏感。

Datainf: Efficiently estimating data influence in lora-tuned llms and diffusion models

ICLR 2024, Columbia University

https://github.com/ykwon0407/DataInf

What is Your Data Worth to GPT? LLM-Scale Data Valuation with Influence Functions

arxiv 2024, Carnegie Mellon University

Do Influence Functions Work on Large Language Models?

EMNLP findings 2024, Singapore Management University

Understanding Impact of Human Feedback via Influence Functions

ACL 2025

https://github.com/mintaywon/IF_RLHF

http://www.jsqmd.com/news/625842/

相关文章:

  • PhpStorm 2026.1 安装配置与环境搭建 (保姆级图文教程)
  • 保姆级教程:在VS2022里一步步配置Qt 5.15.2源码调试环境(附PDB路径避坑指南)
  • CefFlashBrowser:终极Flash浏览器解决方案,轻松重温经典Flash游戏和网页内容
  • 免费在线UML绘图工具:PlantUML Editor终极快速上手指南
  • 家庭婚姻矛盾化解课程推荐 - 中媒介
  • easyGBD
  • 终极指南:如何在Photoshop中免费使用AI图像生成功能
  • WinForm异步编程避坑指南:为什么你的进度条总卡死?5个常见错误解析
  • JBoltAI框架4.2发布!八大核心升级重塑AI开发全场景
  • Windows Server 2019下SuperMapGIS 11i与达梦DM8数据库的完整配置指南(含依赖库获取)
  • 安卓开发调试利器:dmesg与logcat指令的实战对比与应用场景解析
  • 面试官总爱问的LRU缓存,我用Java手写了一个(附完整代码和避坑点)
  • 一套业务代码,多种协议自由切换
  • WebStorm 2026.1 安装配置 与环境搭建 (保姆级图文教程)
  • kill-doc:免费文档下载神器,10分钟变1分钟的终极解决方案
  • 2026贵州贵阳玻璃隔断源头工厂五大品牌深度横评:如何甄选高透光隔音隔断 - 精选优质企业推荐榜
  • 【HarmonyOS 5开发实战】Windows家庭版Hyper-V配置与DevEco Studio环境搭建全攻略
  • 数字孪生与工业大脑:SOP+VisuCAD 的协同中枢
  • Substance Painter高效工作流:快捷键与实用技巧全解析
  • LeetCode--459.重复的子字符串(字符串/KMP算法)
  • FastAPI 数据库连接池优化与高并发实战
  • PyTorch 2.8镜像中的模型安全与鲁棒性测试:对抗样本生成
  • CoPaw性能调优教程:GPU显存优化与推理速度提升参数详解
  • LaTeX2Word-Equation:3秒搞定公式迁移,学术写作效率提升90%
  • 2026年贵州贵阳办公玻璃隔断源头工厂深度横评:五大品牌性价比对标指南 - 精选优质企业推荐榜
  • 别再死记硬背了!用C++图解递归折半查找和二叉排序树,面试官都夸你理解透彻
  • AI+Dify实战:零代码构建新闻聚合与智能分析全栈应用
  • 华为-AC+FIT AP组网(web方式)
  • AI开发-python-langchain框架(--AI 直接生成并执行 Python 代码 )诳
  • 2026贵州贵阳玻璃隔断定制源头工厂对标深评:五大品牌隔音隔热性能与交付周期横评 - 精选优质企业推荐榜