标贝科技语音论文入选全球顶级语音学术大会INTERSPEECH2019

标贝科技论文《基于多任务学习的普通话韵律边界预测模型》在INTERSPEECH2019大会上入选,展示了其在语音科研领域的创新成果。该模型提升了普通话韵律边界预测的准确性和效率,为语音合成技术提供了新的研究方向。
部署运行你感兴趣的模型镜像

全球知名语音学术大会INTERSPEECH2019于9月15日至19日在奥地利格拉茨城市举行。

作为全球智能语音及AI数据发展的推动者,标贝科技受邀成为大会黄金级赞助厂商亮相现场。其中,由标贝语音团队撰写的《A Mandarin Prosodic Boundary Prediction Model Based on Multi-Task Learning》论文成功入选会议,并在现场向来自全球的语音科研机构及企业厂商展现标贝语音科研创新及产品动态。

 

全球语音交流协会INTERSPEECH是世界上规模最大、内容最全面的语音会议。今年恰逢INTERSPEECH成功举办20周年,会议以“Crossroads of Speech and Language”为主题,意在探讨语言多样性、应用多样性以及表达方式多样性,吸引了来自世界各地的近2000名科研学者及企业厂商代表。

历届INTERSPEECH会收到来自全球上千家科研机构及企业厂商投稿,而最终入选的数量却十分有限。缘由国际权威评委的严格标准。本次标贝论文入选大会,体现了中国AI语音厂商在国际语音领域的不俗实力。该论文提出了一种基于多任务学习(MTL)架构的中文普通话韵律边界预测模型. 研究结论表明,该模型有效地解决了普通话韵律边界预测的任务,整体预测性能提高了0.8%,模型尺寸减小了约55%。对语音行业研究中文普通话语音合成效果质量提升提供了一定的研究参考价值。

 

据了解,标贝科技语音及数据核心团队人员拥有超过15年行业经验,拥有业内领先的语音合成技术及数据方案能力,为全球客户提供高品质、多类别、多场景的语音合成方案,以及高质量、安全与多语种为特点的数据服务。截至目前,标贝科技已为微软、百度、阿里、腾讯、字节跳动等海内外100余家企业客户提供服务,项目累计超过300项,涵盖汽车、教育、客服、零售、阅读、智能硬件等应用领域。

标贝科技自成立以来,把AI技术创新放在首位,以“语音连接场景、数据服务技术为理念”,在技术、数据及应用三端不断创新,确保在语音和数据领域的领先地位。

例如,在语音合成方面上,标贝基于Attention机制的深度神经网络技术,充分利用文本数据,构建前端模块、选择合适的声码器,降低运算量,创新语音合成模型,提升语音合成质量效果,并匹配场景应用。以出色的语音技术实力、场景连接能力,赢得客户信任与认可。此外,标贝还自主创新研发TTS评测系统,从前/后端为行业提供评测标准指南,提升语音评测质量整体发展。

同时,在高校科研合作方面,标贝与北京大学、西北工业大学、新加坡国立大学等国际高校建立合作关系,以此获得强有力的产研力量支持。

本届INTERSPEECH2019,标贝科技收获了海外多个地区科研机构和海外客户对标贝自有语音合成方案的认可。未来,标贝科技将与更多科研高校、企业厂商保持紧密的交流合作,携手共同推动语音产业的发展。

完整版论文链接:

https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1400.pdf

您可能感兴趣的与本文相关的镜像

HunyuanVideo-Foley

HunyuanVideo-Foley

语音合成

HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

优快云资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值