40、语音翻译与中文广播语音转录技术解析

语音翻译与中文广播语音转录技术解析

1. 跨语言适应与话题适应的效果

在语音翻译领域,进行分割细化后,对目标语言模型、翻译词典和短语表逐步应用跨语言适应。如同文本翻译的结果一样,语言模型适应和翻译模型适应分别能提升翻译性能。当同时应用这两种适应模型时,提升效果是累加的,与未适应的统计机器翻译(SMT)系统相比,BLEU 得分相对提升 3.2 - 3.6%,NIST 得分相对提升 1.7 - 1.8%。不过,与未适应的语音翻译系统相比,在 95% 置信区间内,BLEU 得分在 [15.12%, 17.65%],NIST 得分在 [5.100, 5.459],这种提升在统计上并不显著。

总体而言,应用话题适应来提高识别准确率有助于提升翻译性能。话题适应后,更好的识别准确率和更精准的翻译模型带来的提升是累加的,与未适应的背景词假设相比,BLEU 和 NIST 得分分别相对提升 1.8% 和 1.1%。与手动转录的翻译结果相比,语音翻译仍有很大的提升空间,也就是说,提高上游的识别准确率有望改善下游的翻译性能。

2. 统一无监督话题适应框架

通过潜在语义分析,提出了一个用于单语言和跨语言适应的统一无监督话题适应框架。该方法能进行高效的话题推断,只需少量文本即可实现快速适应。其贡献包括:
- 提出潜在狄利克雷树分配,它是潜在狄利克雷分配的推广,用于建模话题相关性。
- 将潜在语义分析(LSA)扩展到 N - 元语法 LSA,推导了用于高效训练的变分 EM 算法,并提出分数 Kneser - Ney 平滑方法来处理分数计数。
- 通过双语 LSA 将单语言适应扩展到跨语言适应。由于存在一对一的话题对应关系,双语 LSA 便于在 SMT 解码

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值