分布式语音转文本、翻译和信息提取引擎的系统组合:GALE互操作性演示(IOD)
1. 引言
语音和文本处理引擎,如语音转文本和机器翻译,正被组合成越来越大的引擎组,以实现多个目标:
- 执行日益复杂的任务,例如转录、翻译成英语以及从外语新闻广播中提取信息。
- 促进系统组合技术的应用,以提高准确性。
- 在某个引擎出现故障时提供容错能力。
GALE的语言开发环境(LEE)工作组已开展多项活动,使用非结构化信息管理架构(UIMA)软件框架来实现GALE引擎的互操作性。“互操作性”指的是对一组引擎的单点调用,这组引擎被称为“聚合体”。GALE类型系统(GTS)已被开发为用于此类UIMA聚合体的通用数据格式集。
GALE互操作性演示(IOD)系统采用UIMA和GTS,使来自七个远程站点、跨越三个GALE联盟的15个引擎实现互操作,让阿拉伯语广播新闻和网站能够以按主题分组和总结的英语文本形式浏览,并能以合成英语语音播放。IOD互操作的引擎执行11种不同的功能:
- 语言/方言识别
- 性别确定/说话者检测
- 语音转文本(STT)
- 实体检测(ED)
- 机器翻译(MT)
- 翻译系统组合(多引擎机器翻译或MEMT)
- 故事边界检测
- 故事主题聚类
- 故事主题聚类总结
- 标题生成
- 文本转语音合成
这些引擎运行在分布于多个州和国家的不同计算平台上,其所在站点包括:
- IBM,纽约
- 卡内基梅隆大学,宾夕法尼亚州
- BBN,马萨诸塞州
- 德国亚琛工业大学
- 马萨
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



