回顾丨2023 SpeechHome 第三届语音技术研讨会

原创

已于 2023-12-21 18:22:41 修改 · 2.4k 阅读

27 ·

CC 4.0 BY-SA版权

文章标签：

#语音识别 #人工智能 #大数据 #开源 #AIGC #gpt

于 2023-12-20 20:00:00 首次发布

文章回顾了第三届SpeechHome语音技术研讨会，涉及前沿技术、音频生成、大模型等多个主题，讨论了语音识别、合成、数据治理、开源社区等内容，展示了深度学习在语音领域的最新进展和未来发展趋势。

下面是整体会议的内容回顾：

18日线上直播回顾

18日上午9:30，AISHELL & SpeechHome CEO卜辉宣布研讨会开始，并简要介绍本次研讨会的筹备情况以及报告内容。随后，CCF语音对话与听觉专委会副主任、清华大学教授郑方，国家工业信息安全发展研究中心人工智能所副所长刘永东对本次大会进行开幕致辞。

开幕致辞

接下来是语音前沿技术和音频生成两个主题的内容回顾。

语音前沿技术

上午的语音前沿技术主题主题由AISHELL & SpeechHome CEO卜辉担任主持，分享嘉宾分别是谢磊、万玉龙、李明。

谢磊分享的主题是《西工大ASLP实验室语音生成模型新进展》。报告分享了西工大音频语音与语言处理实验室在语音生成方面的进展，包括拟人化语音合成，基于语音因素解耦的表现力语音合成，基于自然语言的风格迁移、音色生成和语音转换，高表现力与实时语音转换、以及Vec Tok Speech多任务语音大模型技术。

万玉龙分享的主题是《交互式AI中语音技术实践与探索》。本次报告主要介绍了3点内容：1、亿级终端智能助理所面临的语音技术挑战及解决思路；2、音频类生成式AI在智能助理产品的创新实践；3、业务视角下,交互式A对语音技术的期许与展望。