迈向知识图谱与自动文本摘要的探索
1. 叙事框架在多领域的应用及医学领域的探索
叙事元素在不同领域建模叙事时起到框架作用,且因领域特异性而有所不同。在文学领域建模所使用的类和属性,可作为基本框架,随着领域变化进行调整以适应不同领域的叙事。例如,与领域无关的通用模型包含“概念”类,用于关联故事主题;文化遗产领域的模型则侧重于表示该领域的文物和对象类型。
在医学领域,叙事信息的应用具有重要意义,但目前还没有叙事本体模型。相关概念有助于构建框架概念,构建初始框架后进行评估,发现每个患者都遵循一套标准的临床工作流程,将每个过程记录为事件,使模型更简单,能将与每个过程相关的活动连接到单个事件。比如,预评估模型中有事件类和空白节点,每个事件关联多个参与者(如医生、护理人员、患者等),通过为事件类创建实例(如“与医生会面”“就诊”等),减少了建模的复杂性,使相关过程更明确。当框架成熟为图后,可通过运行SPARQL等方法进行评估,这表明语义工件的构建是迭代且不断改进的。
这项工作的动机是捕获非结构化数据类型,如主题访谈、观察记录(通常以录像、录音或笔记形式存在),这些数据包含医学上有意义的信息,但目前未得到充分利用,通常仅用于治疗患者。收集的数据可用于推断更好的结果,未来可构建系统捕获这些数据并应用于社区信息系统,开发终端用户应用程序利用有价值的叙事数据,所开发的框架可部署在这些系统中,有助于制定医院数据管理指南,为患者治疗提供整体方法。
2. 自动文本摘要的背景与目标
如今,网络上文本信息大量增长,信息分析任务变得复杂,自然语言处理方法用于处理海量文本数据问题,文本摘要领域在信息检索中变得重要。人工提取大量文档的摘要非常困难,而自动文本摘要能提取涵盖
超级会员免费看
订阅专栏 解锁全文
129

被折叠的 条评论
为什么被折叠?



