当前位置: 首页 > news >正文

亚马逊NeurIPS 2024论文技术速览

某机构在NeurIPS 2024论文快速指南

尽管大语言模型及其他基础模型占据了重要地位,但某机构长期关注的赌博机问题以及人工智能在自动推理中的应用等新课题也获得了应有的关注。

2024年神经信息处理系统大会(NeurIPS)——人工智能领域的顶级会议——于今日开幕。某机构被接收的论文展示了其人工智能研究的广度。大语言模型(LLM)和其他基础模型在过去几年主导了该领域,某机构的论文也反映了这一趋势,涵盖了检索增强生成、利用LLM进行代码生成、常识推理以及多模态模型等主题。训练方法也成为焦点之一,相关论文涉及内存高效训练、基于人类反馈的强化学习、带拒绝的分类以及Transformer模型中的收敛速率。

同时,某机构的论文也展现了对赌博机问题(长期以来某机构向NeurIPS提交论文的 staple 主题)和语音处理等领域的持续兴趣,以及诸如机器学习在科学计算和自动推理中的应用等较新的关注点。其中一篇论文《B’MOJO: 具有全息记忆和 fading 记忆的基础模型的混合状态空间实现》提出了一种植根于传导学习概念的新的机器学习范式。

自动推理

  • 神经模型检查(Mirco Giacobbe, Daniel Kroening, Abhinandan Pal, Michael Tautschnig)

赌博机问题

  • 无法实验时的自适应实验(Yao Zhao, Kwang-Sung Jun, Tanner Fiez, Lalit Jain)
  • 带扩散先验的在线后验采样(Branislav Kveton, Boris Oreshkin, Youngsuk Park, Aniket Deshmukh, Rui Song)

代码生成

  • 训练LLM以更好地自我调试和解释代码(Nan Jiang, Xiaopeng LI, Shiqi Wang, Qiang Zhou, Baishakhi Ray, Varun Kumar, Xiaofei Ma, Anoop Deoras)

常识推理

  • 语言模型能学会跳步吗?(Tengxiao Liu, Qipeng Guo, Xiangkun Hu, Jiayang Cheng, Yue Zhang, Xipeng Qiu, Zheng Zhang)

计算流体动力学

  • WindsorML: 用于汽车空气动力学的高保真计算流体动力学数据集(Neil Ashton, Jordan B. Angel, Aditya S. Ghate, Gaetan K. W. Kenway, Man Long Wong, Cetin Kiris, Astrid Walle, Danielle Maddix Robinson, Gary Page)

LLM评估

  • SetLexSem挑战赛:使用集合操作评估语言模型的词汇和语义鲁棒性(Bardiya Akhbari, Manish Gawali, Nicholas Dronen)

内存管理

  • 具有未知权重的在线加权分页(Orin Levy, Aviv Rosenberg, Noam Touitou)

模型架构

  • B’MOJO: 具有全息记忆和 fading 记忆的基础模型的混合状态空间实现(Luca Zancato, Arjun Seshadri, Yonatan Dukler, Aditya Golatkar, Yantao Shen, Ben Bowman, Matthew Trager, Alessandro Achille, Stefano Soatto)

隐私保护

  • 利用有限公共数据预训练差分隐私模型(Zhiqi Bu, Xinwei Zhang, Sheng Zha, Mingyi Hong)
  • 对机器遗忘的重构攻击:简单模型是脆弱的(Martin Bertran Lopez, Shuai Tang, Michael Kearns, Jamie Morgenstern, Aaron Roth, Zhiwei Steven Wu)

检索增强生成 (RAG)

  • RAGChecker: 用于诊断检索增强生成的细粒度框架(Dongyu Ru, Lin Qiu, Xiangkun Hu, Tianhang Zhang, Peng Shi, Shuaichen Chang, Cheng Jiayang, Cunxiang Wang, Shichao Sun, Huanyu Li, Zizhao Zhang, Binjie Wang, Jiarong Jiang, Tong He, Zhiguo Wang, Pengfei Liu, Yue Zhang, Zheng Zhang)

语音处理

  • CA-SSLR: 用于通用语音处理的条件感知自监督学习表征(Yen-Ju Lu, Jing Liu, Thomas Thebaud, Laureano Moro-Velazquez, Ariya Rastrow, Najim Dehak, Jesus Villalba)

训练方法

  • CoMERA: 通过秩自适应张量优化实现计算和内存高效训练(Zi Yang, Ziyue Liu, Samridhi Choudhary, Xinfeng Xie, Cao Gao, Siegfried Kunzmann, Zheng Zhang)
  • 用于人类偏好 elicitation 的最优设计(Subhojyoti Mukherjee, Anusha Lalitha, Kousha Kalantari, Aniket Deshmukh, Ge Liu, Yifei Ma, Branislav Kveton)
  • 通过学习密度比率进行拒绝(Alexander Soen, Hisham Husain, Philip Schulz, Vu Nguyen)
  • 揭示Transformer模型的梯度下降动力学(Bingqing Song, Boran Han, Shuai Zhang, Jie Ding, Mingyi Hong)

视频处理

  • 一符标记万物:视频中基于语言指令的推理分割(Zechen Bai, Tong He, Haiyang Mei, Pichao Wang, Ziteng Gao, Joya Chen, Lei Liu, Pichao Wang, Zheng Zhang, Mike Zheng Shou)
  • 用于长视频理解的视频令牌合并(Seon Ho Lee, Jue Wang, Zhikang Zhang, David Fan, Xinyu (Arthur) Li)

视觉-语言模型

  • 用于可解释视觉-语言对齐的统一词汇表征(Yifan Li, Yikai Wang, Yanwei Fu, Dongyu Ru, Zheng Zhang, Tong He)

研究领域

机器学习

标签

NeurIPS, 视觉-语言模型, 视频, 检索增强生成, 大语言模型, 代码生成FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/629847/

相关文章:

  • 从Photoshop到Inkscape:设计师的矢量图形迁移指南(附常用功能对照表)
  • Akagi:麻将AI分析工具的技术实现与应用场景
  • RK平台实战:一个resource.img里塞进两个dtb,实现单固件适配双硬件
  • BOTW-Save-Editor-GUI:塞尔达传说旷野之息存档编辑器的完整指南
  • 终极指南:如何使用KrillinAI轻松制作专业级多语言视频
  • 终极Windows安装指南:如何用MediaCreationTool.bat轻松绕过硬件限制安装Windows 11
  • 01. 基础集成与环境搭建
  • 【大模型持续预训练终极指南】:SITS2026权威发布3大不可逆趋势与5步落地框架
  • Comsol 微穿孔板吸声性能优化:基于多算法对比的结构参数精准调控
  • VTracer完全指南:从位图到矢量的智能转换实战手册
  • 3步掌握Venera漫画源配置:构建跨平台漫画聚合阅读生态
  • 每月 20 美元技术栈:低成本运营高收益软件公司的秘诀
  • 比迪丽LoRA模型与ComfyUI工作流集成:实现复杂角色绘制
  • 智能简化黑苹果配置:OpCore-Simplify让EFI创建从复杂到简单的技术解放
  • 2025年雪球帖子批量下载与PDF导出全攻略:从数据抓取到高效整理
  • 【大语言模型实战】基于Mindie与昇腾硬件高效部署DeepSeek-R1模型
  • Web Scraper:零代码网页数据抓取的终极解决方案
  • Swin2SR在Java项目中的集成指南:SpringBoot图像增强服务开发
  • CH55xduino技术指南:简化低成本USB微控制器开发的完整解决方案
  • 保姆级教程:在Rockchip RK3288上配置OV13850 Sensor、MIPI与ISP驱动的完整流程(附DTS详解)
  • 如何快速使用AI图像增强:让模糊照片变清晰的完整指南
  • 别再为Octovis编译头疼了!Windows下Octomap 1.9.1保姆级配置指南(含VS属性表配置)
  • Source Han Serif CN:免费开源宋体的7种字重完整使用教程
  • 5分钟掌握PyMICAPS:气象数据可视化的Python利器,让复杂天气图变得简单
  • 高效中文语义理解:text2vec-base-chinese深度实战指南
  • 2026届学术党必备的十大降重复率网站实测分析
  • 深入解析DeepSeek模型权重架构与高效推理实践
  • 杂题选做-27
  • Graphormer分子图建模原理:原子中心编码与键距离注意力机制详解
  • 如何在Mac上实现MKV等视频格式的快速预览:终极解决方案指南