当前位置: 首页 > news >正文

An Empirical Study on Commit Message Generation using LLMs via In-Context Learning 论文笔记

介绍

(1) 发表:ICSE'25

(2) 背景

最近的一些工作研究了基于 LLM 的提交信息生成,然而目前尚不清楚 LLM 通过 ICL 在该领域的表现如何

(3) 贡献

本文对通过 ICL 使用 LLM 进行提交信息生成进行了实证研究,并创建了一个新的数据集

工作

(1) 研究设计

  • RQ1:不同的提示和提示设置如何影响基于 ICL 的提交信息生成的性能?

    具体来说,我们根据是否提供了角色描述以及是否给出了约束信息来设计四个提示,并从三个维度(即数量、选择方式和顺序)研究演示设置

    所获得的发现:适度数量的演示会增强性能,但过多的演示会降低性能;基于检索的演示选择可以显著提高性能,而演示顺序对性能的影响最小;GPT-3.5-Turbo 和 DeepSeek-V2-Chat 是提交消息生成任务中性能最佳的 LLM。此外,在通用 LLM 上进行额外的代码预训练并不会产生更好的性能

  • RQ2:基于 ICL 的提交信息生成与最先进的方法相比如何?

    表现最好的 LLM 显著优于表现最好的基线,LLM 58.5% 的表现不佳案例是由不准确的测量引起的,这表明传统指标的局限性,迫切需要新的指标来准确评估基于 LLM 的提交消息生成方法的性能

  • RQ3:LLM 表现不佳的根本原因是什么?

    我们抽样了 200 个 LLM 未能在 RQ2 中做出准确预测的表现不佳的案例,并总结了根本原因的类别。LLM 表现不佳的主要根本原因是缺乏上下文知识、不利的演示和模型谬误。两种潜在的缓解策略是提供高质量的演示和改进大型语言模型

(2) 一些结论

迫切需要高质量的数据集, LLM 作为评估方式是很理想的

总结

基于 ICL 的提交信息生成的一个较为全面的实证研究

http://www.jsqmd.com/news/343/

相关文章:

  • 实用指南:人工智能学习:Transformer结构中的编码器层(Encoder Layer)
  • vcpkg 安装依赖
  • Java03课前问题列表
  • JavaScript错误处理完全指南:从基础到自定义错误实战
  • 1、论文准备
  • Jetpack Navigation - 在 Fragment 中跳转到 Activity(4 种方式) - 详解
  • PION 游击
  • 神经网络构成框架-理论学习 - 指南
  • Web3 开发者修炼全图谱:从 Web2 走向 Web3 的实用的系统性学习指南
  • 强化学习之父 Richard Sutton: 如今AI正进入“经验时代” - 指南
  • Java 注解 - 实践
  • 安规对变压器的绝缘系统要求
  • 嵌入式笔记系列——UART:TTL-UART、RS-232、RS-422、RS-485 - 指南
  • 实用指南:医院高值耗材智能化管理路径分析(下)
  • Flutter应用自动更新系统:生产环境的挑战与解决方案
  • .NET Core中使用SignalR
  • Django + Vue3 前后端分离工艺实现自动化测试平台从零到有系列 <第一章> 之 注册登录完成
  • 实用指南:【保姆级教程】TEXTurePaper运行环境搭建与Stable Diffusion模型本地化
  • 实用指南:修复Conda连接异常:CondaHTTPError HTTP 000 CONNECTION FAILED故障排除指南
  • 高级数据结构手册
  • 3634501 - [CVE-2025-42944] Insecure Deserialization vulnerability in SAP Netweaver (RMI-P4)
  • 【无人艇协同】基于matlab面向海事安全的双体无人艇分布式协同任务规划(目标函数:总时间满意度)【含Matlab源码 14161期】博士论文 - 教程
  • 实用指南:Unity 打包 iOS,Xcode 构建并上传 App Store
  • 实用指南:GitHub 热榜项目 - 日榜(2025-09-09)
  • 深入解析:【Fiora深度解析】手把手教你用固定公网IP搭建专属聊天系统!
  • 使用JavaScript和CSS创建动态高亮导航栏
  • wxt 开发浏览器插件的框架
  • Gridspech 全通关
  • 1967
  • 20253320蒋丰任