当前位置: 首页 > news >正文

Alexa AI在Interspeech会议组织技术专题研讨会

Alexa AI在Interspeech会议共同组织特别研讨会

在今年9月的Interspeech会议上,某中心的Alexa AI团队将共同组织四个特别研讨会——这些是主会议内的主题性分会,目前均在征集论文投稿。

其中一个研讨会关注多设备联网智能设备场景下的机器学习与信号处理。该会议将探讨同步、仲裁(决定应由哪个设备响应用户查询)及隐私等主题。

另一个Interspeech研讨会关注包容性与公平性语音技术。算法偏见在自然语言处理和计算机视觉领域已得到深入研究,但在语音领域则较少。可能的论文主题包括偏见分析与缓解方法、数据集创建以及针对非典型语音的自动语音识别。

第三个研讨会关注可信语音处理,重点开发不仅追求准确性,还兼顾隐私、可解释性、公平性、伦理、偏见缓解及相关目标的新模型。

第四个特别研讨会关注预测语音(包括原始音频信号及助听器生成信号)对听力受损听众的可懂度。该研讨会与为期五年的Clarity Challenge相关,这是一项旨在改进助听器的挑战赛,某中心参与其中。

以下是各研讨会的详细信息。特别研讨会的投稿应通过主会议投稿系统提交,截止日期为3月21日。

多智能设备信号处理与机器学习的挑战与机遇

本次会议旨在通过汇聚产业界与学术界的专家,推动多设备信号处理与机器学习领域的研究。讨论主题包括但不限于:

  • 多设备音频数据集
  • 自动语音识别
  • 关键词检测
  • 设备仲裁(即应由哪个设备响应用户询问)
  • 语音增强:去混响、降噪、回声抑制
  • 声源分离
  • 说话人定位与跟踪
  • 隐私敏感的信号处理与机器学习

该会议将汇集多传感器领域顶尖的研究人员。尽管他们的具体应用可能不同(例如增强与声学事件检测),但问题空间的相似性有助于技术方法的相互借鉴。

包容性与公平性语音技术

某中心的Alexa AI团队与来自全球该领域的领先研究人员共同组织本次会议。会议将包括一系列口头报告(如果接收论文超过六篇,则可能采用两分钟介绍的墙报形式)。论文主题可包括但不限于:

  • 偏见分析与缓解方法,包括算法训练准则;
  • 用于偏见量化的数据集创建、管理与共享,以及数据增强、筛选与编码技术,重点关注标准语料库未覆盖的用户群体;
  • 针对非典型语音的自动语音识别;
  • 关于包容性、语音技术民主化以及为所有人提供无缝语音交互的伦理考量;
  • 在促进公平性的同时应用个性化技术。

可信语音处理

鉴于机器学习系统的普及性,确保数据处理的私密性与安全性至关重要。语音处理因其承载的语言和副语言信息(包括说话人特征、交互和状态特征)而带来一系列独特的挑战。本次特别会议旨在汇聚可信机器学习和语音处理领域的新老研究人员,会议组织者正在寻求来自学术界和工业界研究团队的相关新颖投稿,展示可信语音处理领域理论和实证方面的进展。

感兴趣的主题包括但不限于:

  • 差分隐私
  • 联邦学习
  • 语音处理中的伦理
  • 模型可解释性
  • 语音处理中的偏见量化与缓解
  • 可信语音处理的新数据集、框架与基准
  • 新兴隐私攻击的发现与防御
  • 语音处理应用中的可信机器学习,如自动语音识别

听力障碍听众的语音可懂度预测

全球有3.6亿人受听力障碍影响。听力障碍听众面临的最大挑战之一是在背景噪声中理解语音。开发更好的助听器需要能够获取音频信号、并结合听者特征知识来估算信号可懂度的预测模型。这包括能估计自然信号可懂度的模型,以及能估计经过助听器算法处理后的信号可懂度的模型。

Clarity Prediction Challenge提供了经多种助听器信号处理系统处理的含噪语音信号、对应的可懂度分数,并要求参赛者仅根据信号、其干净参考版本以及每位听者的具体听力障碍特征,生成能够预测可懂度分数的模型。该挑战赛在Interspeech投稿截止日期前持续开放,欢迎所有参赛者投稿。

本次特别会议欢迎Clarity Prediction Challenge的参赛者投稿,同时也邀请关于听力障碍和语音可懂度相关主题的论文,包括但不限于:

  • 用于可懂度预测的统计语音建模
  • 能量和信息噪声掩蔽的建模
  • 利用听力图数据个性化可懂度模型
  • 在线和低延迟环境下的可懂度预测
  • 模型驱动的语音可懂度增强
  • 可懂度模型评估的新方法
  • 用于可懂度模型评估的语音资源
  • 可懂度建模在声学工程中的应用
  • 听力障碍与说话风格之间相互作用的建模
  • 使用Clarity Prediction Challenge提供数据的论文

如何提交论文

提交至多设备信号处理与机器学习会议或包容性与公平性语音技术会议的论文,可通过主会议网站上传。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.jsqmd.com/news/167088/

相关文章:

  • 清华镜像同步上线:Miniconda-Python3.10极速下载,PyTorch环境秒级构建
  • 清华镜像源配置教程:加速Miniconda-Python3.10下载PyTorch依赖库
  • Docker容器资源限制:为Miniconda-Python3.10分配GPU与内存配额
  • ARM 汇编指令:LDM
  • 使用pip和conda混合安装PyTorch时的注意事项与优化建议
  • 2025国内最新化妆品贴牌加工企业top6榜单公布!广东、广州等地区行业优质公司专业解析及选择指南,全链路赋能品牌高效成长 - 全局中转站
  • 打怪抢 BOSS 必备神器!芝麻 BOSS 计时器让你精准拿捏每一波刷新
  • Anaconda虚拟环境对比:Miniconda-Python3.10轻量优势明显
  • SSH隧道转发可视化界面:远程操控Miniconda-Python3.10 GPU容器
  • Anaconda配置PyTorch环境慢?Miniconda-Python3.10提速秘诀
  • Linux命令、Vim编辑器与文件权限管理学习心得
  • 谷歌AI智能体开发指南:从预测式AI到自主问题解决系统的完整构建框架
  • PostgreSQL学习总结(16)—— PostgreSQL 插件之 pgvector
  • 不再问东答西:一文详解大模型如何理解你的指令
  • GitHub项目部署加速:使用Miniconda-Python3.10镜像减少环境配置时间
  • Miniconda中的pip与conda到底该用哪一个安装PyTorch?
  • iPhone17在中国市场爆卖1400万台!这些功能你一定要知道
  • Anaconda配置PyTorch环境太慢?试试轻量级Miniconda-Python3.10镜像
  • HarmonyOS 广告 SDK 封装实战:从原生 Ads Kit 到可复用广告组件
  • 零代码打造专属AI知识助手:本地大模型知识库搭建全攻略
  • 大模型内部策略优化新突破:中科院提出BuPO算法,性能提升超4.69%
  • Markdown文档自动生成系统:依托Miniconda-Python3.10运行大模型
  • GitHub Actions自动化测试:使用Miniconda-Python3.10构建PyTorch CI/CD
  • 虹科答疑 | PCAN-Basic通讯接口配置不踩坑,关键就3步!
  • 零基础转AI大模型:数据分析人员的4个黄金岗位选择,建议收藏!_想转岗AI大模型?看这篇就够了!
  • Markdown静态站点生成:基于Miniconda-Python3.10部署AI技术博客
  • ESP-IDF 如何使用components和自定义工程目录
  • AI开发必备:Claude Skills详解,让你的智能体效率起飞(建议收藏)
  • 从零构建AI写作平台:Miniconda-Python3.10 + 大模型Token生成 pipeline
  • 使用Docker Run运行Miniconda-Python3.10镜像,快速接入AI算力市场