Alexa AI于Interspeech组织语音技术前沿专题会议
在某中心Alexa AI团队的共同组织下,今年的Interspeech会议(9月举行)将设立四个专题分会(即主会议内的主题分会)。目前,所有分会都在征集论文投稿。
其中一个分会关注多网络智能设备场景下的机器学习和信号处理。该分会将探讨同步、仲裁(决定哪台设备应响应用户查询)和隐私等主题。
另一个Interspeech分会关注包容性与公平的语音技术。算法偏见在自然语言处理和计算机视觉领域已得到充分研究,但在语音领域研究较少。可能的论文主题包括偏见分析与缓解方法、数据集创建以及针对非典型语音的自动语音识别。
第三个分会关注可信语音处理,重点在于开发不仅追求准确性,还兼顾隐私、可解释性、公平性、伦理、偏见缓解及相关领域的模型。
最后一个专题分会关注预测语音信号(包括原始声学信号及助听器生成信号)对听力受损听众的可懂度。该分会与为期五年的“Clarity Challenge”(一项旨在改进助听器的挑战赛)相关,Alexa AI也参与其中。
各分会详情如下。专题分会的投稿应通过主会议投稿门户提交。截止日期为3月21日。
多智能设备信号处理与机器学习的挑战与机遇
本分会旨在通过汇集行业和学术专家,促进多设备信号处理和机器学习的研究,讨论主题包括但不限于:
- 多设备音频数据集
- 自动语音识别
- 关键词检测
- 设备仲裁(即哪台设备应响应用户查询)
- 语音增强:去混响、降噪、回声抑制
- 源分离
- 说话人定位与跟踪
- 隐私敏感的信号处理与机器学习
本分会将汇聚多传感器领域的顶尖研究人员,尽管他们的具体应用可能不同(例如增强与声学事件检测),但问题空间的相似性有助于技术的交叉融合。
包容与公平的语音技术
本分会将与全球该领域的领先研究者共同组织。分会将进行一系列口头报告(如果接受论文超过六篇,则可能采用带有两分钟介绍的海报形式),论文主题可涉及但不限于:
- 偏见分析与缓解方法,包括算法训练标准
- 为偏见量化创建、管理和共享数据集,以及数据增强、管理和编码技术,重点关注标准语料库未包含的用户群体
- 针对非典型语音(如肌萎缩侧索硬化症、中风、耳聋、唐氏综合征)的自动语音识别
- 关于包容性、语音技术民主化以及为所有人提供无缝语音交互的伦理考量
- 在促进公平的同时应用个性化技术(即公平意识的个性化)
可信语音处理
鉴于机器学习系统的普遍性,确保数据处理的私密性和安全性至关重要。语音处理因其语言和副语言内容(包括说话人特征、交互和状态特征)所承载的丰富信息而面临独特的挑战。本专题分会旨在汇聚从事可信机器学习和语音处理的新老研究者,分会组织者正在寻求学术界和工业界研究小组展示可信语音处理领域理论和实证进展的新颖且相关的投稿。
感兴趣的主题包括但不限于:
- 差分隐私
- 联邦学习
- 语音处理中的伦理
- 模型可解释性
- 语音处理中的偏见量化与缓解
- 可信语音处理的新数据集、框架和基准
- 新兴隐私攻击的发现与防御
- 语音处理应用中的可信机器学习,如自动语音识别
听力受损听众的语音可懂度预测
全球有3.6亿人受听力障碍影响,听力受损听众面临的最大挑战之一是在背景噪声中理解语音。开发更好的助听器需要能够获取音频信号并利用听者特征(例如听力图)来估计信号可懂度的预测模型。这包括能估计自然信号可懂度的模型,以及能估计经助听器算法处理后的信号可懂度的模型。
Clarity预测挑战赛(为期五年的Clarity挑战赛的一部分)提供了经过多种助听器信号处理系统处理的带噪语音信号、相应的可懂度分数,并要求参赛者仅根据信号、其纯净参考信号以及每位听者特定听力障碍的特征,生成能够预测可懂度分数的模型。该挑战赛在Interspeech投稿截止日期前持续开放,欢迎所有参赛者。
本专题分会欢迎Clarity预测挑战赛参赛者投稿,同时也邀请有关听力障碍和语音可懂度的相关主题论文,包括但不限于:
- 用于可懂度预测的统计语音建模
- 能量和信息噪声掩蔽建模
- 使用听力测定数据个性化可懂度模型
- 在线和低延迟设置中的可懂度预测
- 模型驱动的语音可懂度增强
- 可懂度模型评估的新方法
- 用于可懂度模型评估的语音资源
- 可懂度建模在声学工程中的应用
- 听力障碍与说话风格之间相互作用的建模
- 使用Clarity预测挑战赛提供的数据撰写的论文
如何提交论文
有关多设备信号处理与机器学习分会或包容与公平语音技术分会的投稿,可通过主会议网站上传。
提交您的论文
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
1245

被折叠的 条评论
为什么被折叠?



