当前位置: 首页 > news >正文

Proxy - KD 新方法:突破黑盒大语言模型知识蒸馏限制,性能超传统白盒技术!

致谢与相关信息

我们衷心感谢西蒙斯基金会、成员机构以及所有贡献者的支持。欢迎捐赠。也可了解 arXiv 成为独立非营利组织的相关情况。

搜索信息

计算机科学 > arXiv:2401.07013

搜索选项涵盖所有字段,包括标题、作者、摘要、评论、期刊参考、ACM 分类、MSC 分类、报告编号、arXiv 标识符、DOI、ORCID、arXiv 作者 ID、帮助页面、全文。

快速链接

  • 登录
  • 帮助页面
  • 关于

计算机科学 - 计算与语言

arXiv:2401.07013(计算机科学)

该论文于 2024 年 1 月 13 日提交 ([v1]),最后于 2024 年 11 月 9 日修订(此版本为 v2)。

标题与作者

标题

黑盒大语言模型的知识蒸馏

作者

论文作者包括陈宏展、陈瑞军、易雨琪、全小军、李陈亮、严明、张吉。

可查看由陈宏展等 6 位作者撰写的《黑盒大语言模型的知识蒸馏》论文的 PDF 版本。查看 PDF HTML(实验版)

摘要

鉴于 GPT - 4 等专有大语言模型(LLM)表现卓越,近期研究愈发关注通过知识蒸馏(KD)从这些强大但为黑盒的教师模型提升较小模型的能力。虽然利用这些教师模型的高质量输出有优势,但无法访问其内部状态往往限制了有效的知识转移。为克服这一限制,研究人员提出了 Proxy - KD 这一新颖方法,它使用代理模型来促进知识从黑盒大语言模型高效转移到较小模型。实验表明,Proxy - KD 不仅提升了从黑盒教师模型进行知识蒸馏的性能,还超越了传统的白盒知识蒸馏技术。这种方法为从先进大语言模型中蒸馏知识提供了一个极具吸引力的新途径。

主题

计算与语言 (cs.CL)

引用方式

[arXiv:2401.07013] [cs.CL]
(或对于此版本,使用 [arXiv:2401.07013v2] [cs.CL])
https://doi.org/10.48550/arXiv.2401.07013

arXiv 通过 DataCite 分配的 DOI

提交历史

来自:陈宏展 [查看邮箱]

[v1]2024 年 1 月 13 日星期六 08:43:32 UTC(359 KB)

[v2]2024 年 11 月 9 日星期六 01:35:32 UTC(8,288 KB)

全文链接

可查看由陈宏展等 6 位作者撰写的《黑盒大语言模型的知识蒸馏》论文的 PDF 版本。

  • 查看 PDF
  • HTML(实验版)
  • TeX 源代码

查看许可

当前浏览上下文

cs.CL

< 上一篇 | 下一篇 >

最新论文 | 近期论文 | 2024 - 01

可切换浏览方式:计算机科学

参考文献与引用

  • NASA ADS
  • 谷歌学术
  • 语义学者

导出 BibTeX 引用(加载中...)

BibTeX 格式引用

×

加载中...

数据提供方:

书签

可在以下平台添加书签:

文献工具

文献与引用工具
文献浏览器切换

文献浏览器(什么是文献浏览器?)

关联论文切换

关联论文(什么是关联论文?)

Litmaps 切换

Litmaps(什么是 Litmaps?)

scite.ai 切换

scite 智能引用(什么是智能引用?)

代码、数据与媒体
alphaXiv 切换

alphaXiv(什么是 alphaXiv?)

代码链接切换

CatalyzeX 论文代码查找器(什么是 CatalyzeX?)

DagsHub 切换

DagsHub(什么是 DagsHub?)

GotitPub 切换

Gotit.pub(什么是 GotitPub?)

Huggingface 切换

Hugging Face(什么是 Huggingface?)

ScienceCast 切换

ScienceCast(什么是 ScienceCast?)

演示
Replicate 切换

Replicate(什么是 Replicate?)

空间切换

Hugging Face 空间(什么是空间?)

空间切换

TXYZ.AI(什么是 TXYZ.AI?)

相关论文
推荐器与搜索工具
影响花链接

影响花(什么是影响花?)

CORE 推荐器切换

CORE 推荐器(什么是 CORE?)

  • 作者
  • 出版地
  • 机构
  • 主题

关于 arXivLabs

arXivLabs:与社区合作的实验项目

arXivLabs 是一个框架,允许合作者直接在网站上开发和分享新的 arXiv 功能。

与 arXivLabs 合作的个人和组织都认同并接受开放、社区、卓越和用户数据隐私价值观。arXiv 致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。

若你有能为 arXiv 社区增值的项目想法,可了解更多关于 arXivLabs 的信息

本文的哪些作者是认可者? | 禁用 MathJax (什么是 MathJax?)

  • 关于
  • 帮助
  • 联系 arXiv 点击此处联系 arXiv 联系
  • 订阅 arXiv 邮件 点击此处订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍协助
  • arXiv 运行状态
http://www.jsqmd.com/news/1097172/

相关文章:

  • 智慧教育平台电子课本下载工具:让教学资源触手可及
  • 西门子设备硬件安装调试经验速记系列1(IM151-1Standard扩展子模块-标准灯码故障识别)
  • 小程序公司排行榜有没有参考价值?选服务商更该看这几项
  • Android Studio实战:5分钟搞定OneNET设备数据实时监控(附完整Token生成代码)
  • 杰理之播提示音时连接第二个麦,第二个麦会出现无声问题【篇】
  • 鸿蒙 ArkTS 两大基础事件简单说明
  • 别再用fail2ban了?试试Linux系统自带的账户锁防暴力破解神器faillock
  • 谷歌浏览器多开
  • 太强了!输入关键词,这几款AI论文工具就能帮你搞定毕业论文
  • Windows系统文件abcCertFirm.dll丢失找不到问题解决
  • AI Agent 的模型路由:多模型切换与智能选择
  • 软考网络工程师中级
  • 2026年,行业内口碑好的90kw电力测功机工厂究竟哪家更值得选?
  • 霞鹜文楷:当传统书法美学遇见现代开源代码
  • 别再让老漏洞拖后腿:手把手教你修复CVE-1999-0526和CVE-1999-0554(附NFS安全配置)
  • 1998-2025年上市公司AI技术应用水平
  • 如何在5分钟内搭建专业的无人机强化学习环境:gym-pybullet-drones完整指南
  • AutoGen框架深度拆解:群聊、可定制发言人与嵌套Agent的编程范式
  • mavonEditor代码块增强攻略:提升技术文档编辑效率的完整解决方案
  • 人机协作环路:人在回路中决策节点、审批流转与Agent升级机制
  • CTFshow PWN入门实战:手把手教你用pwntools搞定pwn24(含shellcraft模块详解)
  • 如何高效使用智能漫画翻译工具:面向初学者的自动化解决方案
  • 如何用Sunshine搭建终极免费游戏串流系统:5分钟实现跨平台游戏自由
  • Cellpose cyto3模型:基于深度学习范式的细胞分割方法论革新
  • 800块捡漏Tesla M40,手把手教你搞定Windows 10深度学习环境(含驱动、CUDA、PyTorch避坑指南)
  • qpushbutton,想弄个背景图片给按钮
  • Visual ALM如何用AI与可视化重构研发管理新范式?
  • 解锁Axure中文界面:3步实战教程解决原型设计语言障碍
  • Unity游戏去马赛克插件全攻略:5个免费工具恢复游戏完整视觉体验
  • 2026年优选:无外机厨房空调,哪家公司真正赢得好口碑?