提升开放领域内容生成:文本挖掘与对齐的应用
1. 引言
电子健康服务在医疗管理中正发挥着越来越重要的作用,它能为患者提供有关医疗护理的及时且相关的信息。健康管理向以患者为中心的医疗模式转变,是在线健康服务快速发展的一个重要因素。这种模式旨在让患者直接参与医疗决策过程,为患者提供更好的途径去获取理解自身病情所需的相关信息,使他们能够对规定的治疗方案做出更明智的决策。
现代医生正在利用内容生成等新兴技术,突破医疗的可能性边界,带来曾经只是梦想的新治疗方法和见解。与此同时,医疗系统也面临着提高绩效、降低成本以及应对关键挑战以保障未来发展的巨大压力。医疗领域的内容生成能够为个人提供个性化、原创的建议。
传统的自然语言生成(NLG)方法依赖于三个组件:
- 内容规划器:选择要表达的数据。
- 句子规划器:根据内容规划决定句子或段落的结构。
- 表面实现器:根据句子规划生成最终输出。
近期研究提出了基于编码器 - 解码器框架的端到端模型,用于结构化数据到文本的生成。例如,Wiseman 等人利用编码器 - 解码器生成体育赛事总结;Mei 等人提出了一个对齐器模型,将内容选择机制集成到编码器 - 解码器中,用于从一组数据库记录生成天气预报;Lebret 等人描述了一个用于传记总结的条件语言模型。这些端到端模型在输入有序且结构固定的情况下能生成流畅的文本,但在输入无序时性能较差。开放领域内容生成的一个主要问题是,通过序列到序列模型获得的内容会出现事实和真相的扭曲。
Puduppully 等人提出了神经内容规划,这是一个两阶段模型,包括处理无序输入的内容规划。首先,规划使用指针网络生成内容计划;然后,将生成的内容计划作为编码器
超级会员免费看
订阅专栏 解锁全文
1268

被折叠的 条评论
为什么被折叠?



