自然语言生成内容的处理与优化
1 自然语言生成面临的挑战
1.1 内容选择的不可控性
在基于给定表格生成逻辑相关描述时,由于对表格值可进行大量操作(如计数、比较等),存在多种获取描述的方式。但深度学习(DL)模型在组合生成过程中难以维持高级语义约束,因此无法可靠地选择必要的连接。
1.2 重症监护中的自然语言生成
多数自然语言生成(NLG)技术默认非语言输入信息来自语义明确的知识库。然而,在实际中,许多急需自动文本描述的应用领域并不存在这样的知识库。例如,重症监护环境会产生大量未以逻辑形式结构化的临床数据。数据到文本的NLG是对传统NLG的扩展,可对自然产生的数据进行语言描述。
以下是一些相关的应用案例:
- Hallett和Scott(2005)生成了多个基于文本的健康报告摘要。
- Cawsey等人(2000)描述了一个系统,该系统利用患者病历信息动态生成超文本页面,解释与患者病情相关的治疗、疾病等内容。
- Suregen - 2(H€uske - Kraus,2003a)是最成功的医疗数据到文本应用,可自动编写常规文档,医生常使用它来创建手术报告。
不过,对重症监护室(ICU)数据进行完整总结是一项更复杂的任务,涉及时间序列、离散事件和简短自由文本的处理,目前尚未完全实现。
Hunter等人(2008)的系统分四个主要阶段创建临床数据周期的摘要:
1. 信号分析组件 :使用基于婴儿生理值的建模、自回归滤波和自适应自下而上分割技术,提取生理时间序列的主要特征(伪像、模式和趋势)。
2.
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



