课程概述——李宏毅人类语言处理笔记1
于 2022-11-25 22:42:43 首次发布
本文探讨了自然语言处理中的语音识别技术,包括语音辨识、语音合成、声音分类和文字处理。重点介绍了使用深度学习训练模型进行语音到文字的转换,以及相关的技术如seq2seq模型在语音识别中的应用。此外,还提及了变声器和文法剖析等技术。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
HunyuanVideo-Foley
语音合成
HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效































3241

被折叠的 条评论
为什么被折叠?



