当前位置: 首页 > news >正文

2025_NIPS_Can We Infer Confidential Properties of Training Data from LLMs?

文章核心总结与创新点

一、主要内容

本文聚焦大型语言模型(LLMs)的数据集级属性推理攻击问题,即攻击者能否从微调后的LLMs中推断出训练数据的机密属性(如患者人口统计信息、疾病患病率等)。

  1. 研究背景:LLMs常基于医疗、金融等领域的专有数据集微调,但这些数据集的聚合属性(非个体隐私)可能因模型泄露而危及机密性。此前属性推理攻击研究集中于判别模型(如图像分类)和生成模型(如GANs),LLMs因兼具两类模型特性且数据嵌入方式复杂,相关攻击可行性尚不明确。
  2. 核心贡献
    • 提出PropInfer基准:基于ChatDoctor医疗对话数据集,支持两种微调模式(问答模式Q&A Mode采用有监督微调SFT,聊天补全模式Chat-Completion Mode采用因果语言建模微调CLM-FT),涵盖人口统计信息(患者性别)和医疗诊断频率(精神疾病、消化系统疾病、分娩相关)两类目标属性。
    • 设计两种针对性攻击:
      • 黑盒场景下的生成式攻击:通过设计领域相关提示词生成样本,基于样本标签聚合估算属性比例;
      • 灰盒场景下的词频阴影模型攻击:利用辅助数据集训练多组不同属性比例的阴影模型,提取关键词频率特征训练元攻击模型,进而推断目标模型的属性比例。
  3. 实验结果
http://www.jsqmd.com/news/624954/

相关文章:

  • MogFace-large效果展示:艺术化滤镜、水印覆盖图像中的人脸检测能力
  • 终极指南:北航毕业论文LaTeX模板的完整使用教程,快速搞定格式规范
  • mysql日志管理
  • 碳硅共生:从人机协作到文明共进化——AGI时代智能关系的范式重构与理论建构
  • 手把手教你用AndroidKiller和JADX搞定旧版捕鱼达人内购(附Smali修改实战)
  • Windows Server 2025下载 Windows Server 2022下载 Windows Server 2019下载 Windows Server 2016下载
  • 【AI Agent 从入门到精通】第一章:AI Agent 是什么?一文讲清楚核心概念与架构
  • 高级java每日一道面试题-2025年10月14日-团队协作篇[LangChain4j]-如何设计代码审查标准?
  • C语言函数笔记5:从基础使用到递归与作用域深度解析
  • Transformer模型实战:用Python预测锂电池寿命的保姆级教程(附数据集)
  • 【JavaEE】多线程02—线程安全
  • 从单体LLM API到生产级AI网格:一位CTO带队完成迁移的6周攻坚日志,含全部YAML配置模板
  • Phi-3-Mini-128K实际案例:为芯片设计团队提供Verilog代码规范检查建议
  • 从3月到毕业,大三/研二每个月该干什么?这份校招备战日历建议直接收藏
  • 从理论到实践:忆阻神经网络中的突触与神经元电路设计探析
  • 集成AI 的 Redis 客户端 Rudist发布新版了谔
  • ARMv8架构下Cache一致性:PoU和PoC到底有什么区别?
  • 仅限奇点大会注册开发者获取:LLM生产环境诊断工具包(含自动检测脚本+拓扑分析器+成本优化计算器)
  • 终极免费方案:3分钟搞定Blender到Unity的FBX模型完美导出
  • 从VMware虚拟机到OpenStack云:手把手教你搭建个人私有云实验平台
  • X-Anylabeling实战:从零部署到高效标注的完整指南
  • 比特币白皮书解读:一种点对点的电子现金系统
  • 华为网络设备高效巡检命令全解析(运维必备)
  • AutoJS后台保活实战:从原理到华为手机优化配置
  • Dify插件实战:MCP-Server如何将工作流无缝对接第三方工具
  • AB罗克韦尔1734-IE4S模块双通道模式实战:提升工业控制系统冗余与安全性
  • 如何快速掌握英雄联盟智能辅助工具:League Akari完整使用指南
  • 高效转换B站缓存视频:永久保存珍贵内容的技术方案
  • 保姆级教程:基于ROS Melodic和MoveIt!,手把手搭建双RM65机械臂协同控制系统
  • 大卫小东(Sheldon)媳