利用认知解决智慧城市社会互联医疗中的重复问题
摘要
社交网络已经改变了医疗沟通方式,患者通过与其他患者、看护者以及医疗专业人员的联系来寻求支持和建议。医学论坛中大量健康相关查询及其答案的数量充分证明了这一趋势。持续收集且相互关联的用户生成的社交大数据所具备的可扩展性、自然交互性和动态性,能够支持健康评估、干预和服务提供,从而构建最优的认知型智慧城市。然而,社交媒体在医疗沟通中的应用也面临数据泛滥、可靠性与质量不足、保密性及隐私(位置/个人)问题等挑战。重复问题,即语义(含义)相似的查询,会破坏过滤机制,延长响应时间,并降低答案质量。这项研究提出了针对医疗社区问答网站(医疗CQAs)中重复问题这一关键挑战的解决方案。我们提出采用一种混合深度学习模型来解决语义问题匹配问题,以实现重复问题对检测,该模型结合了基于协同注意力的双向长短期记忆网络(Bi‐LSTM)孪生神经网络和多层感知机分类器,输出两个问题之间相似性匹配的概率。随后使用欧几里得距离函数计算问题之间的相似性。所提出的模型在从 Patient.info社区论坛的三个专题组——“肠易激综合征”、“焦虑症”和“更年期”中抓取的 100个问题对上进行了验证,观察到准确率达到86.375%。所得结果与Quora在重复检测方面的最先进结果相当。
索引术语
重复检测, 深度学习, 孪生神经网络, Smart healthcare
1. 引言
物联网和大数据在构建智慧城市基础设施方面发挥着至关重要的作用,因为它们彻底改变了我们分析人类行为模式和趋势的方式。社交媒体、移动性、分析和云(SMAC)等技术推动了数字模型的创新,从而改变市民服务的提供方式。通过基于位置的移动计算与物联网相结合实现的社交互动,产生了大量有价值的群体感知数据。此外,这些社交媒体平台的云基础设施提供了存储海量数据的可扩展性。利用自动化分析计算处理市民生成的信息,以获得可操作的洞察,从而降低决策过程中的延迟,实现有效的实时智能(图1)。
智慧城市拥有庞大的数据输入,以及大量处理和实施这些数据的方法。近年来,认知分析作为一种基于技术的解决方案,受到了研究人员和从业者的广泛关注。这是一种新颖的信息发现与决策制定方法,利用机器学习、深度学习、人工智能、自然语言处理和图像识别等多种智能技术来理解数据并生成洞见。它被认为是解锁社会城市环境中大数据潜力的关键,可用于实际的数据驱动的决策制定,并促进响应式和智能服务的发展。认知型城市是智慧城市的自然延伸,指能够根据过去经验调整自身行为,并具备理解、学习、感知和响应环境变化能力的城市。在认知型城市中,数据流动不仅发生在市民与城市管理之间(如智慧城市),还包括市民与市民之间以及市民与系统之间的数据交互。市民作为人类传感器,智能框架也演进为信息物理社会系统。该系统在通信环境中考虑更多变量,以提升城市的效率、可持续性和韧性。
计算技术的成熟与采用极大地改变了智慧城市中医疗保健的面貌。技术创新正在变革医疗保健,从而对患者和临床医生体验产生令人振奋的影响。智慧医疗是技术和智能设备的实际融合。本质上,智慧医疗提供电子健康和移动健康服务、电子记录管理、智能家居服务以及智能互联医疗设备。智慧医疗与这些设备产生的各种与个人健康与福祉相关的数据进行交互和处理。
大数据改变了我们在各个行业管理、分析和利用数据的方式。医疗保健是其中一个可以通过数据分析实现积极变革的领域。从形式上讲,医疗数据定义了可收集和解释的患者多种观察结果。医学及相关健康科学中存在大量类型的数据,包括叙述性数据、文本数据、数值测量数据(脉率)、绘图、记录信号(心电图)以及放射影像等数据。叙述性数据占据了患者护理过程中收集信息的重要部分[1]。医疗保健中的主要大数据点如图2所示,包括理赔数据、药品数据、医院数据、临床数据(来自电子病历(EMR))、可穿戴设备数据、健康调查数据和社会媒体数据(建议/观点/经验)[2]。
医疗保健大数据分析是指收集和分析来自各种医疗保健数据点的数据,即来自个人用户、消费者或医院的汇总级别数据,以生成有助于决策制定、针对性健康计划和以患者为中心的情报。通常,医疗保健数据分析有助于:
- 利用数据驱动的发现预测包括流行病在内的健康问题
- 快速评估医疗程序和治疗方法
- 亲自管理库存并降低成本
- 通过工具让更多患者参与自身健康管理,培养自我护理
无处不在的无线互联网接入推动了新型以用户为中心的应用和富媒体服务的使用。由于无处不在的数据收集、持续的公民参与以及高级分析能够促进向具备实时智能的认知型城市的转变。普遍存在的社交网络正在改变医疗沟通方式,患者越来越多地利用在线社交网络与其他患者和医疗专业人员建立联系[3]。临床试验的电子健康记录、执业人员评价与评分、个性化健康公告、在线医疗建议以及在松散编码的健康社区中的实时叙述,是当前医疗保健领域的一些最新趋势[4]。智慧医疗模型的优势包括:提供健康信息、解答医学咨询、促进对话、收集患者数据、增强互动性和可及性、健康促进与教育、公共卫生监测,并通过同伴/社交/情感支持和在线咨询减轻污名化。然而,社交媒体在医疗沟通中的应用也存在缺乏可靠性、质量担忧以及保密性和隐私问题。此外,由于医疗专业人员可能并不经常使用社交媒体进行交流,传播有害或错误建议的风险可能导致不良健康后果。
医学论坛通过让医疗保健周期中的所有利益相关者参与,解决智能医疗系统中的混乱和信息鸿沟问题,从而打造一个无缝、高质量且强大的生态系统 [5]。它是一个在线智慧医疗讨论板,用户可以在其中发起对话关于任何健康相关的话题,患者或其看护者都可以在此类医学论坛中获得来自其他患者或看护者的意见、知识和经验方面的支持 [6]。活跃用户的数量、开放式问题与答案的多样性以及讨论帖的数量反映了这些医学论坛的受欢迎程度。“群体智慧”的开放性参与提升了此类论坛的信息价值。论坛内的分享与共情使这些健康社区变得具有治疗性。围绕健康问题的社会支持本质上可分为建议性、信息性、工具性和情感性 [7]。
论坛允许用户以协作方式提问并获取答案。但随着越来越多的用户加入,信息过载成为一个不容忽视的挑战,导致出现大量问题和答案。此外,用户往往不愿在网页或论坛中浏览或搜索信息,而更倾向于发布已有答案的相似意图问题。这种冗余不仅耗费了用户的宝贵时间,也占用了论坛的后端存储空间。因此,为了提升用户体验,必须过滤出相关信息(最佳答案/语义匹配的问题/专家)。
许多论坛可能会建议用户在发布新问题之前,先查看讨论帖中是否有相似查询。然而,这种方法并不总是有效,因为用户可能会以完全不同的方式提出相同的问题。检测问题之间的语义等价是一项具有挑战性的任务,因为:
- 同一个问题可以以多种形式进行改写,即有多种方式来提问同一个问题
- 可能存在询问不同内容但寻求相同解决方案的问题
- 重复检测是在问题发布后并可能已收到一些答案的情况下进行的,这使得问题线程的合并变得复杂
- 从大量历史问题中选择候选重复内容
通常,“句子相似度”或“释义检测”是指检测相似或重复的句子,这些句子不仅在词的相似性上匹配,而且在词的含义上也相匹配。图3展示了在Patient.info医学论坛的焦虑症讨论中发布的两个语义上等价的示例查询。
重复问题检测旨在对问题对进行语义匹配,以便将具有相似意图的问题归为一组。重复问题会破坏过滤机制,影响响应时间并增加答案过载。因此,关注重点需要从“信息过载”问题转向“过滤失效”的障碍。在句子之间检测语义等价性因此是自然语言处理中的一个持续存在的问题。
基于深度学习的软计算技术通过分层学习能力和泛化能力 [8],在某些特定语言问题上取得了最先进的结果。它们在无需人为干预且无需对所有内容进行标注的情况下,从训练集中有限的特征集外推新特征的能力已得到证实,相比传统的机器学习技术取得了卓越的效果。近年来,各种神经网络架构,例如孪生网络 [9] 和注意力 [10, 11], ,已被广泛用于通过多种技术处理语义相似性问题。孪生神经网络是一种包含两个或多个相同子网络 [12] 的神经网络模型。这种相同行为由具有相同参数和权重的相同配置描述 [13]。输入被转换为表示向量,并通过距离度量来计算其相似性或差异。诸如卷积神经网络(CNN)、循环神经网络(RNN)及其变体等流行的深度神经网络架构被用于构建用于语义匹配的孪生神经网络。与此同时,上下文感知表示学习(如协同注意力方法 [10], )已在大量任务中实现了具有竞争力的效果。
本研究阐述了一种用于分析在线医疗社区中问题的模型,通过基于深度学习的孪生神经网络进行语义匹配,以发现重复问题对。提出了一种混合模型,该模型结合了孪生神经网络和多层感知机(MLP)分类器,用于输出两个问题之间相似性匹配的概率。孪生神经网络包含两个结构相同的子网络,均基于协同注意力机制的双向长短期记忆模型( Bi‐LSTM),并使用欧几里得距离函数计算问题之间的相似性。在输出层采用了多层感知机(MLP)分类器,从而实现重复问题对的检测。协同注意力机制有助于捕捉更深层次的相互依赖表示。所提出的模型在从“Patient.info”论坛抓取的问题对上进行了验证,该论坛是一个在线讨论平台,提供与特定疾病相关的观点、事实和经验。因此,这项研究的主要贡献在于:提出一种用于语义匹配的普通协同注意力双向LSTM孪生神经网络模型,以实现并编码输入问题的向量表示;使用欧氏距离计算两个向量之间的匹配程度;以医学论坛为应用领域,研究问题对中的语义相似性匹配
本研究旨在设计、应用并评估自纠错和人类认知作为社会互联的智慧城市医疗生态系统中持续学习的关键知识发现驱动因素。在社会互联的医疗问答论坛中,个人健康信息被主动分享,而信息过载是一个不容忽视的因素。我们展示了使用深度学习来解决医学论坛中的重复问题,以支持智慧医疗系统。本文结构如下:第2节回顾相关文献工作,第3节描述智慧城市中的认知分析。第4节阐述所提出的模型及其使用的概念。第5节讨论结果,最后,第6节给出研究的结论及未来展望。
2. 相关工作
智慧城市的高度动态性要求新一代的机器学习方法具备灵活性,能够适应数据的动态变化,以执行数据分析并从实时数据中进行学习。在认知城市中需要深度学习,因为它能够吸收认知型智慧城市中收集的所有变量和数据(如物联网、社交媒体、政府等),从而提供具有高预测准确率的最佳自适应解决方案。此外,三种类型的深度学习算法——判别式、生成式和混合式——支持广泛的应用场景。
近年来,各种神经网络架构已被广泛用于处理语义相似性问题,并采用了多种技术 [14]。使用孪生神经网络架构检测语义等价句子在近年来取得了显著进展 [12, 13]。在 Kaggle发布了一项挑战赛以识别Quora上的重复问题后,已有研究报道了针对Quora平台的重复问题检测工作。王等人 [15] 对Quora进行了详细分析,考虑了基于用户主题图、社交关系图以及连接相关问题的图这三种不同连接网络的影响。萨迪等人 [16] 针对 Quora数据集上的自动重复问题检测提出了全面的实证分析。罗德里格斯等人 [17] 在其研究中报告了在若干成熟方法以及一种新颖技术上进行系统化实验的重复问题对检测结果。
陈等人 [18] 应用了简单的特征工程以及更复杂的基于神经网络的模型来解决Quora上的重复检测问题。张等人 [19] 提出了在Stack Overflow上使用的DupPredictor,该模型通过综合考虑问题的标题、描述、与问题相关的标签以及潜在主题等多个因素,识别新问题的潜在重复内容。阿哈桑扎曼等人 [20] 提出了一种名为Dupe的模型,该模型基于逻辑回归分类技术,在分析了Stack Overflow上出现重复问题的原因后用于检测重复问题。
席尔瓦等人 [21] 开展了一项实证研究,分别对DupPredictor和Dupe进行了复现,称为 DupPredictorRep和DupeRep。表1总结了当前在重复问题对检测领域内一些现有的近期相关工作。
| 作者及年份 | 技术 | 数据集 |
|---|---|---|
| 全等人(2005) [22] | 基于翻译的检索模型 | Naver |
| 张和罗(2015) [23] | DupPredictor | Stack Overflow |
| Bogdanova 等人(2015) [8] | SVM和CNN | Ask Ubuntu |
| 阿哈桑扎曼等人 (2016) [20] | 判别式分类器 | Stack Overflow |
| Dey 等人(2016)[24] | SVM | SemEval 2015 |
| 罗德里格斯等人 (2017) [17] | SVM、CNN、DNN、DCNN | Ask Ubuntu和Quora |
| Addair (2017) [25] | 卷积神经网络、长短期记忆网络、混合式 (CNN+LSTM) | Quora |
| 席尔瓦等人 (2018) [21] | DupPredictorRep 和 DupeRep | Stack Overflow |
| Sharma 等人 (2019) [26] | 连续词袋神经网络 | Quora |
| Abishek 等 (2019) [27] | 卷积神经网络和长短期记忆网络 | Quora |
| Kaur 等 (2019) [28] | 基于依赖图的匹配算法 | Quora |
| 梁等人(2019)[29] |
自适应多注意力网络
(AMAN) |
CQADupStack 和
Quora |
显然,重复问题对匹配领域的工作主要局限于当前的社区问答(CQA)论坛,如 Quora、Stack Overflow以及其他通用社交媒体网站。而近年来兴起的医疗保健社交媒体服务在重复性问题方面的研究则较少被探索。这项研究提出了一种基于模型的解决方案,用于消除医疗社区问答中的重复问题对。据我们所知,目前尚未有文献报道关于医学论坛中问题对相似性匹配领域的相关工作。此外,由于注意力机制已成为自然语言处理( NLP)领域基于神经网络的模型的重要组成部分,本文采用一种新颖的基于协同注意力的技术,通过捕获更深层次的相互依赖表示来聚合问题中的相关信息。在下一节中,我们将详细阐述为在线医学论坛提出的重复检测模型。
3. 提出的基于协同注意力的双塔Bi‐LSTM与欧氏相似度
社区问答网站中的文本匹配问题可能不仅存在于对称领域,也可能存在于非对称领域。例如,释义识别是对称任务,而问题‐答案匹配和蕴含分类则被视为非对称领域[30]。在本研究中,采用基于协同注意力的双向LSTM双塔神经网络来检测语义相似的问题对,这通常是一项对称任务。
形式上,语义问题对匹配问题定义为:给定一个问题对 q1 和 q2, ,训练一个模型以进行分类,如公式 (1) 所示:
c(q1, q2) → 0 or 1 (1)
其中1表示q1和q2具有相似意图且为重复内容,0表示非重复。
孪生神经网络由两个相似的网络组成,这两个网络接受不同的输入,但在顶部通过一个能量函数连接。该函数计算每一侧最高层特征表示之间的某种度量 [12, 13]。输入被转换为表示向量,并利用距离度量来计算其相似性或差异。也就是说,我们将查询映射到相应的分布向量,最终计算它们之间的语义相似性。因此,问题对中的每个问题分别传递给系统的独立子网络。协同注意力能够实现上下文感知表示学习,并动态推断语义相关性。它使模型能够捕捉长依赖句子级特征,并为查询对生成更深层次的相互依赖的表示。此外,采用欧氏距离来衡量问题之间的语义相似性和距离。编码器向量表示及其距离随后作为输入提供给多层感知机(MLP)模型进行二分类。使用多层感知机是因为与其它基于概率的模型相比,它不对所考虑模式类别的潜在概率密度函数或其他概率信息做出任何假设,而是通过训练直接得到所需的决策函数。图4展示了提出的深度神经网络模型。
3.1. 输入层
在此层中,问题对中的每个问题都会被传递到系统的独立子网络。由于该系统是孪生网络,因此每个子网络具有相同的参数和权重。
3.2. 嵌入层
各种词嵌入方法,如独热编码、Word2Vec 和 GloVe [31] ,被用于语言处理任务。这项研究中,使用基于计数的模型 GloVe 在嵌入层将输入问题转换为词向量表。该方法使用共现计数矩阵来生成嵌入。矩阵的每一行代表一个词,每一列代表词可能出现的上下文。矩阵的值表示一个词在给定上下文中出现的频率。然后对该矩阵进行降维处理,以生成最终的嵌入矩阵(矩阵的每一行将是一个词的嵌入向量)。每个问题的嵌入矩阵随后被输入到编码层。
3.3. 编码层:Siamese Co-Att双向LSTM
编码层将GloVe生成的词矩阵转换为一维特征向量。在本研究中,基于协同注意力的双向LSTM构建在编码层上。
双向LSTM
双向LSTM包含两个网络,一个以前向方向读取信息,另一个以反向方向读取信息。这样,输出由过去和未来上下文共同生成。
长短期记忆(LSTM)[32]被提出作为对经典RNN的改进。LSTM的核心是利用隐藏状态来保留已经通过它的输入信息。单向LSTM仅保留过去的信息,因为它所看到的输入仅来自过去。在训练过程中,误差反向传播以调整权重,同时保持训练特性。遗忘门、输入门和输出门以及输入细胞状态的计算使用公式(2)至(7)进行:
i௧ ൌ σ ሺwೣ x௧ w ℎ௧ିଵ bሻ (2)
f௧ ൌ σ ሺwೣ x௧ w ℎ௧ିଵ bሻ (3)
o௧ ൌ σ ሺwೣ x௧ w ℎ௧ିଵ bሻ (4)
s௧ ൌ tanℎ ሺw௦ೣ x௧ w௦ ℎ௧ିଵ b௦ሻ (5)
c௧ ൌ f௧ ⊙c௧ିଵ i௧ ⊙s௧ (6)
ℎ௧ ൌ tanℎ ሺc௧ሻ⊙ o௧ (7)
其中, ⊙ 表示逐元素乘积, wwww௦ 表示映射在隐藏层输入与门及输入细胞状态之间的权重因子。 bbbb௦ 表示偏置向量, 其中 σ 是用作门激活函数的 sigmoid 函数, tan h 是双曲正切函数。
Y୲ ൌ ሾh୲ି୬, . . . . . . . , h୲ିଵ ሿ 表示 LSTM层 的输出,作为所有输出的 向量。
使用双向LSTM以两种方式运行输入,一种是从过去到未来,另一种是从未来到过去。与单向LSTM的不同之处在于,在反向运行的LSTM中,我们保留了来自未来的信息,并且通过结合两个隐藏状态,能够在任意时间点保留来自过去和未来的信息。由双向 LSTM层生成的输出向量的每个元素均通过使用(8) [33]计算得出:
y୲ ൌ σ ሺh →t, h↔tሻ (8)
其中,
σ函数是一个用于合并两个输出的拼接函数/求和函数/平均函数/乘法函数, h→表示前向层的输出序列,该序列通过从时间t‐n到时间t‐1的正序输入迭代计算得到。
h↔表示反向层的输出序列,该序列通过使用从时间t‐n到t‐1的反转输入计算得到。
因此,双向LSTM层的输出可以用向量表示,如公式(9)所示。
Y௧ ൌ ሾy௧ି,.......,y௧ିଵሿ (9)
协同注意力机制
基线对称(Vanilla Co‐Attention)机制[8]的工作方式如下:该层的输入来自双向 LSTM层的编码表示。设aത 、bത为这些编码表示。通过将每个词经过Fሺ形成相似性(亲和力)矩阵s ∈Rೌൈ್ ,如公式(10)所示:
s ൌ Fሺaതሻ ். Fሺbതሻ (10)
其中,
s ∈Rೌൈ್和aത以及bത分别是a和b中的第ith个和第jth个词,
Fሺ.ሻ是一个单层前馈神经网络fሺxሻ ൌ ReLUሺWሺxሻ bሻ。
我们在池化层使用抽取式池化。抽取式池化通过对s进行按列和按行的最大池化来实现,如公式(11)和(12)所示。
aᇱ ൌ Sሺmaxሺsሻሻ ் a (11) and
bᇱ ൌ Sሺmax௪ሺsሻሻ ் b (12)
其中, s ∈R ೌൈ್ 是亲和力矩阵, Sሺ.ሻ是softmax函数,
a ᇱ,b ᇱ是共注意力表示的 a and b分别。
直观上,最大池化根据每个词在另一段文本所有词中的最高重要性来选择每个词。
相似度度量
在所提出的模型中,为了找到向量表示之间的相似性距离,我们应用了欧几里得距离函数(13)
dሺx,yሻ ൌ ට∑ ሺxሺiሻ െ yሺiሻሻ ଶ ିଵ ୀ (13)
也就是说,在k维空间中给定两个向量x和y,向量x和y之间的欧氏距离定义为连接x 到y的线段长度。它考察成对对象坐标之间的平方根距离。如果点(x1, y1)和(x2, y2)位于二维空间中,则可以使用勾股定理来计算两点之间的距离,如图5所示。
3.4. 输出层
输出层运行一个多层感知机(MLP)分类器来进行预测。这生成了一个混合Siamese网络和MLP网络,其中Siamese编码器的输出被输入到多层感知机(MLP)中以建模两个问题之间的交互。因此,在所提出的模型中,MLP以问题表示及其距离的拼接,c =[f (q1); f (q2); d (q1, q2)],作为输入,并输出两个问题之间匹配概率的形式。最终输出层由一个单一的(1 x 2)向量组成,该向量的两个元素分别对应于两个类别:非重复和重复。在本研究中,对argmax取此向量以生成最终预测。<算法1>提出了语义匹配模型。
算法1. 提出的语义匹配模型
输入: q1, q2, 元迭代次数 i
输出: 匹配概率
1: 初始化阶段:
2: q1 query1
3: q2 query2
4: for 1 到 i do
5: embedq1= siamesenetwork(xq1)
6: embedq2= siamesenetwork(xq2)
7: 训练_孪生网络 (embedq1, embedq2)
8: es 欧几里得相似度(V1, V2)
9: train _多层感知机(V1, V2, es)
10: 结束 for
11: return匹配概率
4. 结果
本节讨论了用于此项工作的数据集,以及所提出模型的性能结果。一个子章节将所提出模型的结果与各种其他孪生子网络变体进行了比较。同时还展示了与最先进的Quora重复检测结果的对比分析。针对各种问题类型观察了结果,并使用不同的相似性度量对深度混合模型的性能进行了评估。
4.1. 数据集
Patient.info 将人们与有助于他们终身保持健康的知识联系起来。它是一个强大的支持论坛,让患者及其看护者能够从社交互动中获益,同龄人之间通过分享知识、观点和经验进行交流。由于这项研究的目的是提取重复问题,因此仅考虑具有疑问性质的帖子,包含经验和观点的帖子被舍弃。该数据集通过从Patient.info的三个专题组——“肠易激综合征”、“焦虑症”和“更年期”中抓取100个问题对而构建。数据集已标注重复与非重复标签。表2展示了所创建数据集中的部分样本条目。
| 输入1 | 输入2 | 是否重复? |
|---|---|---|
| 进食后出现焦虑症状 | 进食或站立后出现心脏问题/焦虑症状 或站立后 | Y |
| 我害怕患上癌症或任何类型的疾病,我需要帮助。 | 健康焦虑!对癌症着迷! | Y |
| 心跳加速…但脉搏是正常....这是怎么回事? | 左侧胸部有剧烈的、突发的、电击样疼痛胸部....焦虑? | N |
| 肠易激综合征发作,求助? | 肠易激综合征会引起这种情况吗?! | N |
| 围绝经期或焦虑或??? | 焦虑?围绝经期?还是两者都有?严重的身体症状。 | Y |
| 抗抑郁药有帮助吗? | 针对焦虑和其他围绝经期症状 | N |
| 是否与避孕药使用有关? | 围绝经期:有人服用拉莫三嗪吗? | N |
4.2. 所提出模型的性能
相似性匹配任务通过实施欧氏混合孪生神经网络模型完成,该模型以问题对作为输入,并使用MLP分类器判断问题对中的问题是否重复。性能以准确率进行评估。为了获得更好的结果,已使用一组不同的参数多次进行了实验。也就是说,我们使用验证数据来调整超参数,以获得最佳结果。GloVe维度设置为300,批量大小为60,dropout(丢弃率)为0.5。Bi‐LSTM隐藏单元数量设置为300,并使用dropout操作进行正则化。Bi‐LSTM丢弃率和学习率分别设置为0.2。混淆矩阵如图6所示。
图7展示了相同的AUC‐ROC(曲线下面积‐受试者工作特征)图。该模型达到了86.375%的准确率。
AUC‐ROC曲线是一种用于直观衡量分类问题性能的二维曲线。x轴显示假阳性率(也称为特异性),y轴表示真阳性率(也称为敏感性)。较高的AUC意味着模型的二元预测能力更强(0作为0,1作为1)。ROC曲线是根据TPR与FPR绘制的,其中TPR位于y轴,FPR位于x轴。
4.3. 与其他Siamese模型的比较
将提出的Siamese协同注意力双向LSTM模型的性能(准确率)与其他Siamese模型在医学论坛数据中检测重复内容的性能进行比较(图8)。这些模型包括:
- Siamese LSTM
- 带注意力机制的Siamese LSTM
- Siamese双向LSTM
- 具有注意力机制的孪生双向LSTM
- 具有协同注意力机制的孪生双向LSTM
所有这些模型都使用欧氏距离作为相似度度量。该图清楚地说明了所提出的模型在医学论坛中检测重复问题方面的性能优于其他Siamese模型。
4.4. 与最先进的结果的对比分析
针对社区问答网站中重复问题对检测的相关研究,主要集中在Quora上,其次是Stack Overflow。由于Quora是一个涵盖所有主题的通用社区问答网站,而Stack Overflow面向软件开发者,因此我们采用Quora的最先进的结果进行对比分析。
我们认为,86.375% 的准确率结果与 Quora 使用带拼接的 LSTM(87%)、带距离与角度的 LSTM(87%)以及可分解注意力模型(86%)所取得的最先进的结果相当 [34]。[30] 中的作者训练了自己的词嵌入,并将其输入到编码层中。所使用的数据集是 Kaggle 上公开的重复问题数据集。Honnibal [35] 提出了一种神经词袋模型,达到了 82.8% 的准确率。Erogol [36] 的另一项研究使用 GloVe 嵌入并训练了基于欧氏相似度的孪生卷积神经网络,报告的准确率为 79%。图9 以图形方式展示了这一比较。
4.5. 不同相似度度量下的性能
我们还评估了模型在距离度量变化下的性能。我们将欧氏距离与曼哈顿距离、雅卡尔距离和闵可夫斯基距离进行了比较(图10)。
4.6. 不同问题类型的性能
我们使用精确匹配度量评估了模型对各种问题类型的性能,即‘wh’类型(什么,谁,为什么,何时,何地,哪个)、‘是’、‘是’、‘应该’和‘如何’(图11)。
观察发现,模型对以‘何时’开头的问题表现最佳,其次是‘谁’和‘如何’开头的问题。以‘为什么’开头的问题最难匹配。
5. 结论与未来展望
社交技术正在从根本上改变我们沟通、协作、消费和创造信息的方式。迫切需要挖掘社会化医疗社区(如医学论坛)中的用户生成的大数据,以实现个性化和实用的数据驱动型医疗保健管理。为了解决医学论坛中用于重复检测的语义问题匹配问题,我们提出了一种混合模型,该模型结合了基于协同注意力的双向长短期记忆孪生神经网络和多层感知机分类器,用于查找重复问题对。采用欧几里得相似性度量来输出两个问题之间相似性匹配的概率。实验达到了86.375%的准确率,与在Quora上获得的重复问题对检测的最先进结果相当。
作为未来研究方向,我们计划构建一个整体医疗CQA模型,该模型能够将新发布的内容分类为查询或经验,并进而理解重复内容。还可以进一步开展针对医学论坛中回答帖子的相关性分类研究,以实现对回答帖子的排序。医疗论坛中的隐私保护是另一个需要探索的动态研究领域,旨在防止机密个人信息的泄露。我们还希望关注将动态共同注意力和具有注意力路由的胶囊网络实施到模型中,以改善实验结果。此外,将所提出的模型应用于其他大规模数据集也将是验证模型鲁棒性的重要课题。
医疗问答重复检测模型
882

被折叠的 条评论
为什么被折叠?



