Task-oriented Dialogue System for Automatic Diagnosis论文笔记-优快云博客

发表时间：2018
论文链接:https://www.aclweb.org/anthology/P18-2033
代码：https://github.com/LiuQL2/MedicalChatbot
代码语言：python

摘要

本文构建了一个用于自动诊断的对话系统。首先，从线上医学论坛上病人的自述以及病人医生间的交谈中提取症状，从而构建数据集；然后，本文提出了用于自动诊断的任务型对话系统框架，该系统能够通过与病人交谈，获取除病人自述外的其他症状。实验表明，从交谈中获取的额外症状能够极大地提升疾病诊断精度，本文的对话系统能够自动地收集这些症状，而且诊断准确度更高。

数据

数据是从中文医学网站上的儿科中收集的，包括四种疾病类型：上呼吸道感染、儿童功能性消化不良、腹泻和支气管炎。标记数据包括两个过程：症状提取、症状归一化。

症状提取

图1 标记数据时，采用BIO进行症状识别，每个提取出的症状表述打上True或False的标签来表明病人有没有该症状。

症状归一化

不同人表述症状是不一样的，比如有人说拉肚子，有人说腹泻，因此要将这些症状表述为专业术语，采用的是SNOMED CT（一种临床医学语标准）标准，如图2所示。通过病人所提供的症状可以分为两类：显性症状和隐性症状。显性症状是指病人在咨询时提供的症状，如病人说：“医生，我流鼻涕打喷嚏，这是怎么回事啊”，其中鼻流涕和打喷嚏就是两个显性症状。隐性症状是指医生通过咨询获知的症状，如医生接着问：“那你拉肚子不？”，此处的腹泻就是隐性症状。

在这里插入图片描述

图2

本文框架

本文对话系统框架包括三大模块：NLU(自然语言理解)：检测用户意图、提取槽位值；DM(对话管理)：追踪对话状态、给出系统行动；NLG(自然语言生成)：根据系统行动生成自然语言。其中NLU和NLG模块都是采用基于模板的方法，重点研究DM模块。
DM模块包含两个子模块：对话状态追踪（DST）和策略学习。