远程医疗干预对抑郁症患者的有效性

最新推荐文章于 2025-10-26 20:27:00 发布

原创最新推荐文章于 2025-10-26 20:27:00 发布 · 803 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#远程医疗 #抑郁症 #随机对照试验 #Healthlines #自我管理

抑郁症患者综合远程医疗服务的有效性：一项复杂干预的实用性随机对照试验

背景

许多国家正在探索远程医疗干预措施在管理慢性疾病患者数量上升方面的潜力。然而，关于远程医疗有效性的证据尚不明确。基于一个基于证据的概念框架，我们为慢性疾病开发了一种综合远程医疗服务（Healthlines服务），并评估了其在抑郁症患者中的有效性。我们的目标是比较Healthlines抑郁症服务加常规护理与单独的常规护理。

方法

本研究是一项实用性、多中心、随机对照试验，参与者来自英格兰三个地区的43家全科诊所。纳入标准包括：参与者需能够使用互联网和电子邮件，患者健康问卷‐9（PHQ‐9）评分至少为10分，并有确诊抑郁症。参与者按个体分配（1:1）分为两组：一组接受Healthlines抑郁症服务加常规护理，另一组仅接受常规护理。随机分配通过基于网络的自动化随机系统完成，按地点分层，并根据全科诊所和PHQ‐9评分进行最小化分配。参与者知晓其分组情况，但结局分析采用盲法。Healthlines服务包括由非临床、受过培训的健康顾问通过交互式软件生成的标准脚本进行定期电话呼叫。在完成初步评估和目标设定电话后，顾问在随机化后4个月内对每位参与者进行6次电话随访，之后最多再进行三次约每两个月一次的电话，以加强干预并检测复发。顾问支持参与者使用在线资源（包括计算机化认知行为疗法），并鼓励采取更健康的生活方式、优化药物治疗以及提高治疗依从性。主要结局是在随机化后4个月时对干预有反应的参与者比例（定义为PHQ‐9<10且PHQ‐9评分降低≥5分）。主要分析基于意向性治疗原则，不进行填补，所有严重不良事件均被调查。本试验注册于当前对照试验，编号ISRCTN 14172341。

发现

在2012年7月24日至2013年7月31日期间，我们招募了609名参与者，随机分配307人至Healthlines服务加常规护理组，302人至常规护理组。主要结局数据可获得于525名（86%）参与者。在4个月时，干预组255名个体中有68名（27%）出现治疗反应，而常规护理组270名个体中有50名（19%）（校正比值比1·7，95% 置信区间1·1–2·5，p=0·019）。与仅接受常规护理相比，干预组参与者报告焦虑有所改善，获得支持与建议的机会更好，对所获支持的满意度更高，并在自我管理和健康素养方面有所提升。试验期间，参与者共报告70起不良事件，其中仅一起与干预相关（因讨论抑郁症导致焦虑加重），且不严重。

解释

这种基于非临床培训的健康顾问支持患者使用互联网资源的远程医疗服务，与常规护理相比，既可被接受又有效。我们的结果支持在其他慢性疾病中开发和评估类似干预措施，以扩展医疗服务的提供。

资金

英国国家健康研究所（NIHR）。

引言

慢性疾病患病率不断上升，对主要依赖患者与医生面对面会诊的医疗系统能力构成了挑战。国际上对利用技术帮助个人管理自身健康问题、减少预约需求的兴趣日益增加与专业人员。这些技术统称为远程医疗，包括电话支持、信息传递、基于互联网的方法和远程监测。一些干预措施可以实现自动化，并由非临床培训人员提供支持，从而扩大服务范围并增加获得护理的机会。英国卫生政策设想远程医疗将成为主流。1在美国，退伍军人健康管理局已在其家庭远程医疗计划中招募了超过50,000名患者，而Renewing Health联盟正在九个欧洲国家测试远程医疗项目。

尽管人们对远程医疗充满热情，但其益处的证据却模糊且不一致，部分原因在于许多干预措施缺乏充分的理论基础。2,3针对不同疾病的系统评价已显示特定技术对选定患者有益，但很少有研究探讨这些技术在大规模真实世界实施中的有效性。2此外，仅关注特定应用的价值有限，因为这些技术的使用无法脱离医疗保健系统孤立地考虑。英国国家医疗服务体系五年前瞻规划提出，真正需要的是所谓的组合式创新——一种将不同技术与工作方式变革相结合以彻底改变医疗服务交付的方法。4

我们开发了一种新的照护模式，旨在通过结合使用各种技术，并由非临床培训人员提供支持，同时与医疗保健系统相整合，以改善慢性疾病患者的管理。该方法结合了公认的慢性疾病管理改进策略，以及技术的应用以减少与临床医生面对面接触需求的方式实施这些策略，使用具有最佳有效性证据的特定远程医疗工具，以及利用技术确保与初级保健的整合。目的是改善医疗服务的可及性，扩大医疗服务供给而不依赖临床工作人员，提供更有效的治疗，并改善自我管理，从而提升患者结局。

本文描述了在抑郁症治疗中应用这一方法的一项试验。抑郁症影响英国3%的成年人，在约一半的患者中表现为慢性或复发性疾病，约占初级保健咨询的四分之一，并对生活质量产生显著负面影响。5来自系统评价的证据支持抑郁症远程医疗干预的有效性，包括通过电话6或互联网7–10提供的干预措施。然而，超过一半的患者会退出在线治疗，9而在基于互联网的干预中加入治疗师支持可提高有效性并改善参与者的保留率。7,9,10

通过一系列研究，包括文献回顾、11定性研究、12以及对患者观点的调查，13我们开发了一个基于证据的概念模型，用于有效利用远程医疗以改善慢性疾病的管理——即慢性病中的远程医疗（TECH）模型（附录第1页）。14 该TECH模型在慢性病照护模型的基础上构建，15

研究背景本研究之前的证据

关于不同慢性疾病的具体远程医疗干预措施，已有大量科学文献。在开发Healthlines干预之前，我们对现有的系统评价进行了元综述。我们在2005年1月1日至2010年3月31日期间检索了MEDLINE、 Embase/AMED、PsycInfo、Web of Science、疗效评价摘要数据库（DARE）和Cochrane图书馆，查找相关系统评价。我们组合使用了有关系统评价、远程医疗或远程医学以及一系列重要慢性疾病的检索词（附录第13页）。我们得出结论：尽管已开展许多研究，但其中许多研究质量较差，样本量小，存在方法学局限，随访时间短，且干预措施缺乏充分的理论基础。这一结论得到了一项更近的证据综合的支持，该综合显示存在发表偏倚，并认为慢性疾病远程医疗的证据基础“总体上薄弱且相互矛盾”。我们补充了这些系统评价，进一步对抑郁症远程医疗的现有系统评价进行了元综述，重点关注哪些技术对哪些患者群体效果最佳。这些评价为基于电话和计算机化的抑郁症干预措施提供了支持，特别是基于认知行为疗法（CBT）的互联网干预，尽管证据基础中的局限性和不一致性仍然显著。

一些证据表明，专业支持可以提高计算机化认知行为疗法的有效性。最近的综述进一步支持了这些结论。尽管在政策层面普遍看好远程医疗项目，但在真实实施环境中针对广泛患者群体开展的大规模实用性试验却很少。

本研究的附加价值

我们的试验在以往证据的基础上，通过测试一种结合多种远程医疗工具并由非临床培训人员提供支持的新型医疗服务模式，进一步推进了该领域的发展。本研究为整合式远程医疗方法在初级保健中支持抑郁症患者的潜在作用提供了有力支持。我们的结果显示，Healthlines抑郁症服务提高了达到治疗反应的患者比例，并在焦虑、自我管理、患者满意度和医疗可及性方面带来了改善。

所有可获得证据的意义

远程医疗干预对慢性疾病可带来虽小但有意义的患者改善。基于连贯的概念模型设计干预措施，并结合多种基于证据的方法，可能会提高其有效性。本研究的令人鼓舞的结果证明，有必要为其他慢性疾病开发类似的干预措施。

研究方法设计和参与者

该研究是一项实用性、多中心、随机对照试验。参与者在英格兰三个地区（布里斯托尔、谢菲尔德或南安普顿周边）招募。本试验已获得国家研究伦理服务委员会西南—弗伦奇伊分部批准（编号12/SW/0009）。研究方案此前已有报道。16有意获取干预材料更多信息的读者可参阅研究网站。

参与者从43家全科诊所招募，这些诊所覆盖了具有不同社会人口学特征的人群。纳入标准包括：患者健康问卷‐9（PHQ‐9）17得分至少为10分，临床访谈时间表修订版（CIS‐R）量表18上确诊抑郁症，年龄在18岁及以上，并能使用电话、互联网和电子邮件。如果参与者目前正在接受心理健康工作者的心理治疗或个案管理；在过去12个月内分娩；有严重的双相情感障碍、精神病、痴呆、严重学习障碍或物质依赖病史；正在接受姑息治疗；存在显著的自杀风险；或无法用英语进行口头交流，则被排除。此外，如果全科医生（GP）认为参与研究可能造成痛苦（例如，因近期丧亲），潜在符合条件的参与者也会被排除。

通过检索计算机化的全科医疗记录中在过去2个月内因抑郁症或情绪低落就诊或被开具抗抑郁药的患者，确定可能符合条件的参与者。我们要求全科医生对名单进行筛查，以排除已知不符合纳入标准的患者。每个全科医疗单位中随机抽取的部分可能符合条件的患者会收到邮寄的研究相关信息和PHQ‐9问卷。对研究表示有兴趣且PHQ‐9评分至少为10的患者将由研究人员通过电话进行筛查，以确认其合格性，包括使用CIS‐R确认抑郁症诊断。符合条件的患者将被要求完成基线问卷并签署知情同意书。

无论是在线还是通过邮寄。如果受访者在合格性评估期间表明有自杀意念，我们会要求其全科医生评估是否应将其排除在试验之外。

随机化和设盲

同意参与的参与者被 individually 随机分配（1:1）至干预加常规护理组或仅常规护理组。分配通过由布里斯托尔随机对照试验协作组（布里斯托尔，英国）独立开发的自动化网络随机系统完成。随机化按地区（布里斯托尔、谢菲尔德或南安普顿）分层，并按全科诊所和基线PHQ‐9抑郁评分（10–14，15–19， ≥20）最小化。参与者的分配结果通过电子邮件通知。参与者知晓自己被分配至干预组或对照组。结局数据通过参与者自报或从全科医疗计算机记录中电子下载获取，试验统计人员在不知晓分配情况的前提下分析结局。

程序

这是一项复杂的干预措施，通过非临床培训人员支持的技术应用，以解决TECH模型的各个组成部分。为了将该模型应用于特定的临床疾病，我们试图确定在该疾病中具有一定有效性证据且可用于实施TECH模型策略的远程医疗工具。因此，不同示例疾病的特定远程医疗工具各不相同，但均通过Healthlines服务在一个共同的干预框架内进行交付（抑郁症的框架见附录[p 2]）。

该干预最初由NHS Direct的工作人员提供， NHS Direct在2014年3月之前通过全国呼叫中心网络和网站提供各种远程医疗服务。2014年3月NHS Direct关闭后，Healthlines服务被转移至索伦特NHS信托。

Healthlines服务基于健康顾问的定期电话支持，健康顾问由交互式软件提供辅助。这些顾问虽不具备临床资质，但拥有在NHS Direct工作的经验，并接受了额外为期3周的培训，内容包括健康指导、动机性访谈、抗抑郁药物治疗、计算机化认知行为疗法（CBT）项目的使用以及Healthlines电话支持软件的操作。借助交互式软件生成的脚本，顾问帮助参与者实现其自身的健康目标，并引导他们访问相关的在线资源，包括可靠的健康信息、交互式项目以及相关的应用程序和小工具（例如，帮助增加锻炼的应用）。顾问会通过电子邮件向参与者发送相关网站链接，或通过邮寄方式寄送信息。

参与者被授予访问 Healthlines 网站门户的权限，该门户链接到多种资源，包括“充实地生活互动项目”（LLTTFi）计划。这一交互式多媒体计划通过六个自主进行的疗程，提供基于计算机化的认知行为疗法的抑郁症治疗，大约每两周完成一次。19或者，参与者也可选择以书籍形式学习类似内容。20

该网站门户还提供了关于抑郁症的信息、相关患者主导的组织的链接，以及通往大白墙的链接，大白墙是一个包含临床医生监管的在线论坛的数字心理健康网络。

在初步评估和目标设定电话咨询后，顾问会在4个月内大致均等地给每位参与者拨打六次电话，随后每隔约两个月再拨打最多三次电话，以加强干预并检测复发。除了提供认知行为疗法项目（在线或书籍形式）使用方面的支持外，电话脚本还包括抑郁症症状监测、药物治疗、药物依从性、锻炼和饮酒行为等模块。为确保与初级保健的协调，顾问通过电子邮件定期向参与者的全科医生发送进展报告，并通过Healthlines网站门户抄送给参与者。在治疗反应不佳的情况下，顾问会联系参与者的全科医生，建议增加药物剂量，并附上当前治疗指南的摘要。这种方法基于我们的目标，即支持而非削弱参与者主要初级保健提供者的工作。每次尽可能由同一位顾问给参与者打电话，因为我们已确定避免采用匿名呼叫中心的方式对于提高参与者参与度至关重要。

Healthlines网站门户上提供了顾问的照片，以增强个性化护理的感受。为方便获得护理服务， Healthlines服务在工作日上午10点至晚上8点以及周六上午10点至下午2点提供。

NHS Direct在试验即将结束时关闭，因此干预措施的实施暂停了2个月，直到转移到索伦特NHS信托。在此转移期间，五分之二的参与者出现了服务提供的中断，部分参与者在12个月随访期结束前未能收到预定数量的全部电话。

结局

主要结局为对干预有反应的参与者比例，定义为随机化后4个月时PHQ‐917评分低于10分且PHQ‐9评分较基线降低至少5分；次要结局包括在8和12个月时作为二分类结局的PHQ‐9，在4、8和12个月时作为连续型结局的PHQ‐9；焦虑（GAD‐7）；21生活质量（EQ‐5D‐5L）； 22对接受治疗的满意度以及获得支持程度的满意度（患者满意度）；感知到的医疗服务可及性；自我管理技能和自我效能（HeiQ）；23远程医疗干预的使用情况；药物依从性（Morisky）；24健康素养（eHEALs）； 25以及对护理协调的感知（Haggerty）。26我们预先设定了关于互联网使用和体验的问题，但未对其进行分析，以减少次要结局的数量。这些次要结局为选择评估干预措施对TECH模型各个组成部分的效应。

在基线时，我们还收集了社会人口学特征和抑郁症当前治疗的详细信息。所有指标均通过患者问卷在基线以及随机化后4、8和12个月时在线或通过邮寄方式完成收集。我们尝试通过电子邮件、电话和邮寄方式对无应答者进行随访。在第二次提醒时，参与者可选择仅完成主要结局的评估，该评估可通过邮寄、电子邮件或电话进行。12个月后，我们从计算机化的全科医疗记录中收集了关于就诊和抗抑郁药处方的数据。我们从Healthlines服务记录中获取了干预措施使用情况的数据。所有潜在的严重不良事件均进行了调查。不良事件主要是在12个月随访期内资源使用数据收集过程中发现的，这些数据要么来自患者问卷，要么来自试验结束时对参与者初级保健医疗记录的审查。我们收集了在12个月期间初级保健记录中记录的任何住院就诊或新发或复发的严重医疗事件的数据。

统计分析

我们根据可能影响临床实践且具有可行性的效应大小，实用性地确定了样本量。假设对照组的治疗反应率为 30%，失访率为20%，每组300名参与者将提供80%的检验效能（α为5%）来检测13%的差异，以及90%的检验效能（α为1%）来检测18%的差异。

我们使用描述性统计方法按分配组比较试验参与者的基线特征。如果发现干预组与对照组之间存在重要不平衡，则在主要结局的敏感性分析中将这些变量纳入回归模型。除使用多重插补数据的回归模型采用QR分解外，所有回归模型均采用最大似然估计进行拟合。

我们使用混合效应逻辑回归模型进行主要分析，该模型根据地点（分类变量）、结局的基线值（连续型）和全科医疗（分类变量，作为随机效应纳入）这些分层和最小化变量进行了调整。在主要分析中，我们按照意向性治疗原则，纳入了所有具有完整数据且按所分配治疗方案进行的参与者，不进行填补。我们还探讨了不同缺失结局数据插补方法对主要分析结果稳健性的影响：包括假设无治疗反应的单一插补或多重插补（附录第5 页）。27此外，我们还分析了省略全科诊所作为随机效应、以及调整随机化与随访之间的时间和基线时组间不平衡变量的影响。

通过拟合试验组与亚组变量之间的交互项，我们探讨了Healthlines干预的效应是否因基线时按性别、年龄、PHQ‐9评分、抑郁严重程度或抗抑郁药物使用定义的亚组而异。


			16,570名患者受邀	16,570名患者受邀	16,570名患者受邀	16,570名患者受邀	16,570名患者受邀

							14 195 被排除 9555 无应答 4400 拒绝参与 240 其他	14 195 被排除 9555 无应答 4400 拒绝参与 240 其他	14 195 被排除 9555 无应答 4400 拒绝参与 240 其他	14 195 被排除 9555 无应答 4400 拒绝参与 240 其他

			2375 人进行合格性评估	2375 人进行合格性评估	2375 人进行合格性评估	2375 人进行合格性评估

							1766 被排除 1649 不符合纳入标准 967 PHQ‐9 评分 <10 438 无 CIS‐R 抑郁症诊断 67 无互联网或电子邮件 177 其他任何原因 25 拒绝参与 92 其他	1766 被排除 1649 不符合纳入标准 967 PHQ‐9 评分 <10 438 无 CIS‐R 抑郁症诊断 67 无互联网或电子邮件 177 其他任何原因 25 拒绝参与 92 其他	1766 被排除 1649 不符合纳入标准 967 PHQ‐9 评分 <10 438 无 CIS‐R 抑郁症诊断 67 无互联网或电子邮件 177 其他任何原因 25 拒绝参与 92 其他	1766 被排除 1649 不符合纳入标准 967 PHQ‐9 评分 <10 438 无 CIS‐R 抑郁症诊断 67 无互联网或电子邮件 177 其他任何原因 25 拒绝参与 92 其他

			609 随机分配 609名受试者入组	609 随机分配 609名受试者入组	609 随机分配 609名受试者入组	609 随机分配 609名受试者入组


	307 分配至干预加常规护理 307接受干预 86 完全接受（9 或 10 次电话） 131 部分接受（3 至 8 次电话） 78 接受很少或没有（2 次或更少电话） 12 数据缺失	307 分配至干预加常规护理 307接受干预 86 完全接受（9 或 10 次电话） 131 部分接受（3 至 8 次电话） 78 接受很少或没有（2 次或更少电话） 12 数据缺失	307 分配至干预加常规护理 307接受干预 86 完全接受（9 或 10 次电话） 131 部分接受（3 至 8 次电话） 78 接受很少或没有（2 次或更少电话） 12 数据缺失	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误	302人分配至仅接受常规护理组 301人接受了常规护理 1人未接受分配的常规护理 1 接受了干预的一部分，原因是行政错误


	255 在 4 个月时进行评估 52 被排除在分析之外 1 主要结局不完整 27 退出研究 24 失访	255 在 4 个月时进行评估 52 被排除在分析之外 1 主要结局不完整 27 退出研究 24 失访	255 在 4 个月时进行评估 52 被排除在分析之外 1 主要结局不完整 27 退出研究 24 失访

	252 8个月时评估 61 被排除在分析之外 1 主要结局不完整 33 退出研究 27 失访	252 8个月时评估 61 被排除在分析之外 1 主要结局不完整 33 退出研究 27 失访	252 8个月时评估 61 被排除在分析之外 1 主要结局不完整 33 退出研究 27 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访	263 8个月时评估 39 排除在分析之外 17 退出研究 22 失访

	255 12个月时评估 52 被排除在分析之外 36 退出研究 16 失访	255 12个月时评估 52 被排除在分析之外 36 退出研究 16 失访	255 12个月时评估 52 被排除在分析之外 36 退出研究 16 失访	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡	261 12个月时评估 41 排除在分析之外 19人退出研究 20人失访 2人死亡

270 4个月时评估 32 排除在分析之外 2 主要结局不完整 9 退出研究 21 失访	270 4个月时评估 32 排除在分析之外 2 主要结局不完整 9 退出研究 21 失访	270 4个月时评估 32 排除在分析之外 2 主要结局不完整 9 退出研究 21 失访

常规护理 alone (n=302)*	干预加常规护理 (n=307)*
人口统计学
年龄（年） 50·0 (12·8)†	49·1 (12·9)‡
女性 204/302 (68%)	213/307 (69%)
白人 292/301 (97%)	300/306 (98%)
就业状况
全职就业 92/299 (31%)	88/303 (29%)
兼职就业 39/299 (13%)	56/303 (18%)
全日制教育 2/299 (1%)	5/303 (2%)
失业 13/299 (4%)	14/303 (5%)
因长期疾病/残疾无法工作 78/299 (26%)	73/303 (24%)
因照护责任无法工作 2/299 (1%)	4/303 (1%)
完全退休不工作 44/299 (15%)	40/303 (13%)
在家照顾家庭 10/299 (3%)	13/303 (4%)
做其他事情 19/299 (6%)	10/303 (3%)
职业（最近或当前）
行政或秘书类职业 51/262 (19%)	49/270 (18%)
专业技术人员或技术类职业 37/262 (14%)	35/270 (13%)
初级职业 21/262 (08%)	19/270 (7%)
经理或高级官员 32/262 (12%)	41/270 (15%)
个人服务 28/262 (11%)	27/270 (1%)
流程、工厂和机器操作员 11/262 (4%)	15/270 (6%)
专业人员 35/262 (13%)	42/270 (16%)
销售和客户服务 35/262 (13%)	29/270 (11%)
技术工种 12/262 (5%)	13/270 (5%)
最高教育程度
学位或更高学位 84/298 (28%)	68/303 (22%)
A‐levels或同等学历 54/298 (18%)	63/303 (21%)
GCSEs/O levels或同等学历 119/298 (40%)	130/303 (43%)
无资格证书 41/298 (14%)	42/303 (14%)
住宿
自有住房或贷款购房 162/300 (54%)	179/307 (58%)
部分租房或租房住宿 124/300 (41%)	118/307 (38%)
免费居住 14/300 (5%)	10/307 (3%)
多重剥夺指数 18·0 ( 13·0 ) §	18·3 (12·8)‡
临床数据
既往抑郁症治疗史 258/276（93%）	269/295（91%）
PHQ‐9 评分 16·7 ( 4·7 ) †	17·1 ( 4·5 ) ‡
GAD‐7 评分 12·4 ( 5·0 ) ¶	13·5 (4·6)
根据 CIS‐R 被归类为轻度抑郁 52/302 (17%)	39/307 (13%)
根据CIS‐R被归类为中度抑郁 148/302 (49%)	165/307 (54%)
根据CIS‐R被归类为重度抑郁 102/302 (34%)	103/307（34%）
服用抗抑郁药 258/288 (90%)	251/289（87%）

*分母因缺失数据而有所不同。†n=302。‡n=307。§n=301。¶n=298。||n=304。
表1：基线特征

结果

在2012年7月24日至2013年7月31日期间被招募并随机分配至研究组。在评估合格性的2375名参与者中，1649名（69%）不符合合格性标准，主要原因为未达到抑郁症的诊断标准（1649名不符合合格性标准的患者中有1405[85%]未满足诊断标准）。在726名符合条件的参与者中，609名参与者被随机分配，其中307名分配至干预加常规护理组，302名分配至常规护理 alone 组（图1）。干预组获得了255名（83%）参与者的主要结局数据，常规护理组获得了270名（89%）参与者的主要结局数据。我们保留了516名（85%）参与者直至最终的12个月随访评估。

表1显示了进入随机化的参与者基线特征。大多数参与者患有严重且持续性抑郁症。在有数据的患者中，基线时205名（34%）被归类为重度抑郁，527名（92 %）既往曾接受过抑郁症治疗，509名（88%）目前正在服用抗抑郁药物。干预组和对照组总体上均衡良好，但在工作状态、教育程度、住宿、抑郁严重程度以及抗抑郁药使用方面存在较小差异。

对主要结局的分析显示，在干预组的255名参与者中，有68名（27%）在4个月时对治疗有反应，而对照组的270名参与者中有50名（19%）有反应（校正比值比[OR] 1·7，95%置信区间1·1–2·5，p=0·019；表2）。两组间治疗反应比例的这一8%差异相当于需治疗人数为12。该结果在敏感性分析中保持稳健（附录第6页）。未发现证据表明该干预措施对任何基于基线特征定义的亚组具有差异性效应。

在8个月和12个月时，两个组别中对治疗产生反应的参与者比例均有所上升（表2）。尽管组间差异似乎随着随访时间的延长而减小，但未发现治疗组与时间点之间存在交互作用的证据（p interaction =0·402）。因此，我们基于4、8和12个月的全部随访数据，在两项重复测量分析（二分类和连续型）中估算了总体治疗效应。结果提示，在12个月随访期内，干预措施具有积极的平均效应（治疗反应的二分类分析p=0·035）。两个组别的平均PHQ‐9评分也随着时间推移而下降（表3），且无证据显示治疗组与时间点之间存在交互作用（p interaction =0·345）。对连续型PHQ‐9评分进行的重复测量分析提供了总体治疗效应较小的证据（p=0·045）。

常规护理干预加常规护理校正比值比 (95%置信区间) p值	常规护理干预加常规护理校正比值比 (95%置信区间) p值	常规护理干预加常规护理校正比值比 (95%置信区间) p值	常规护理干预加常规护理校正比值比 (95%置信区间) p值	常规护理干预加常规护理校正比值比 (95%置信区间) p值	常规护理干预加常规护理校正比值比 (95%置信区间) p值
4个月 50/270 (19%) 68/255 ( 27% ) 1·7 ( 1·1–2·5 ) 0·019	4个月 50/270 (19%) 68/255 ( 27% ) 1·7 ( 1·1–2·5 ) 0·019	4个月 50/270 (19%) 68/255 ( 27% ) 1·7 ( 1·1–2·5 ) 0·019	4个月 50/270 (19%) 68/255 ( 27% ) 1·7 ( 1·1–2·5 ) 0·019	4个月 50/270 (19%) 68/255 ( 27% ) 1·7 ( 1·1–2·5 ) 0·019	4个月 50/270 (19%) 68/255 ( 27% ) 1·7 ( 1·1–2·5 ) 0·019
	8个月	61/263 (23%)	75/252 ( 30% )	1·4 ( 1·0–2·2 )	NC
12个月 86/261 (33%) 95/255 ( 37% ) 1·2 ( 0·9–1·8 ) NC	12个月 86/261 (33%) 95/255 ( 37% ) 1·2 ( 0·9–1·8 ) NC	12个月 86/261 (33%) 95/255 ( 37% ) 1·2 ( 0·9–1·8 ) NC	12个月 86/261 (33%) 95/255 ( 37% ) 1·2 ( 0·9–1·8 ) NC	12个月 86/261 (33%) 95/255 ( 37% ) 1·2 ( 0·9–1·8 ) NC	12个月 86/261 (33%) 95/255 ( 37% ) 1·2 ( 0·9–1·8 ) NC
	4、8和 12个月效应*	··	··	1·6 ( 1·0–2·6 )	0·035

数据以 n/N ( % ) 表示，除非另有说明。所有分析均根据地点（布里斯托尔、谢菲尔德或南安普顿）以及基线 PHQ‐9 评分。全科诊所作为随机效应纳入。NC=未在各个时间点单独计算；分析方案指定的重复测量分析。*基于进一步按重复测量分析调整的结果作为分类变量的随访时间点。
表2：将治疗反应作为二分类结局的重复测量分析

表3显示了次要结局的结果，远程医疗干预的使用情况除外，该内容见附录（第7页）。通过GAD‐7量表评估，该干预与焦虑改善相关。此外，干预还与自我管理技能和态度的多项指标改善以及健康素养提高相关。干预组参与者对医疗可及性、治疗以及所获得支持程度的满意度更高。但未发现抗抑郁药物依从性或护理协调改善的证据（表3），也未发现参与者更频繁使用其他健康相关技术（附录第7页）。为便于呈现，表3仅显示12个月随访后的次要结局数据。4个月和8个月后的结果详情见附录（第8页）。

干预措施的使用情况差异很大，一些参与者在几次电话呼叫后便退出，而另一些参与者则完成了全部的电话呼叫课程。图2显示了干预组参与者在最多次数中的 Healthlines接触次数十次接触。中位接触次数为五次（IQR 2–9，295名参与者有可用数据），平均接触时长为18.5分钟（标准差 12.7），总共进行了1972次接触电话。

常规护理	干预加常规护理	调整后的差异平均值（95%置信区间）	p值
患者中有数据的患者未校正平均值（标准差）	患者中有数据的患者未校正的平均 (SD)
PHQ‐9评分（连续性结局）
基线 302 16·7 (4·7)	307 17·1 (4·5)	··	NA
4个月 270 13·8 (6·2)	255 13·3 (6·1)	–0·8 (–1·8 到 0·1)	NC
8个月 263 13·4 (6·2)	252 12·4 (6·2)	–1·2 (–2·2 到 –0·3)	NC
12个月 261 11·9 (6·4)	255 11·6 (6·2)	–0·5 (–1·5 至 0·5)	NC
4、8和12个月效果的平均值* ··	··	–0·8 (–1·6 至 0·0)	0·045
广泛性焦虑（GAD‐7）21	237 9·2 (5·8)	223 8·7 (5·5)	–1·1 (–2·0 至 –0·2)
生活质量（EQ‐5D‐5L）22	227 0·564 (0·30)	219 0·569 (0·30)	–0·003 (–0·04 到 0·04)
对治疗的满意度†‡	184 3·3 (0·9)	193 3·7 (0·9)	0·5 (0·3 到 0·6)
获得护理方面的困难†‡	232 4·2 (1·9)	216 4·5 (1·9)	0·3 (0·0 到 0·6)
对所获得支持量的满意度†‡	177 2·1 (0·9)	185 2·6 (0·8)	0·6（0·4至0·7）
自我管理技能和自我效能（健康教育影响问卷）23	235 2·4 (0·9)	221 2·5 (0·9)	··
体力活动†（HeiQ 健康导向行为量表）	237 2·4 (0·9)	221 3·0 (0·5)	0·1 (<0·0 到 0·2)
自我监控和洞察力†	238 2·6 (0·6)	221 2·7 (0·6)	0·1 (0·0 到 0·2)
建设性态度和方法†	239 2·6 (0·5)	221 2·8 (0·5)	0·0 (–0·1 到 0·1)
技能和技术习得†	238 2·8 (0·6)	220 2·9 (0·6)	0·2 (0·1 到 0·2)
卫生服务导航†	179 3·4 (0·9)	173 3·2 (1·1)	0·2 (0·1 到 0·3)
抗抑郁药物依从性 (Morisky)24†	235 3·7 (0·8)	220 3·9 (0·8)	–0·1 （–0·2 至 0·1）
健康素养（eHEALs）25†	··	··	174 ··
护理协调（Haggerty）26	176 3·1 (2·2)	179 3·5 (2·4)	··
角色明确与协调†	236 3·1 (1·0)	219 3·2 (1·0)	–0·1 (–0·2 到 0·1)
照护计划的证据†	230 3·2 (1·2)	210 3·1 (1·2)	0·3 (–0·1 到 0·8)
总体医疗保健组织体验†	··	··	··
自我医疗保健组织†	··	··	··

所有分析均根据地点（布里斯托尔、谢菲尔德或南安普顿）、结局基线值（如已测量）以及基线PHQ‐9评分进行调整。全科诊所被作为随机效应纳入分析。PHQ=患者健康问卷。HeiQ=健康教育影响问卷。NC=未在个别时间点计算；分析计划规定采用重复测量分析。NA=不适用。*基于对随访时间点作为分类变量进一步调整的重复测量分析。†得分越高表示结果越积极（访问困难越少，满意度越高）。‡基于在主要试验分析前通过主成分分析生成的量表，并结合了来自现有经验证问卷的问题或为本研究设计的问题。
表3：次要结局及用于评估它们的指标

在干预组的307名参与者中，仅有86名（28%）接受了至少九次电话接触，最多可进行十次。表4显示了依从者在12个月时的粗略估计效应，将干预组中的部分依从者分别归类为非依从者或完全依从者后的结果。结果表明，当依从性被定义为完成大部分或全部 Healthlines接触次数时，效应有所增加。

12个月随访时PHQ‐9应答情况	部分依从者分类为 non-依从者	部分依从者被归类为完全依从者常规护理干预加常规护理
未接受干预（开始0–2次交流）	86/261 (33%)	16/52 (31%)
部分干预已接受（开始3–8次交流）	··	42/111 (38%)
完全干预已接受（开始9–10次交流）	··	36/86（42%）

数据以n/N（%）或未校正比值比（95%置信区间）表示。我们估算了依从者在12个月时的效应，因为这是计划接受完整治疗的时间长度干预。三名从未接受过Healthlines干预的参与者和一名仅接受过一次非预约非通话的参与者被归类为未接受任何干预。12名参与者有缺失的接触数据。
表4: 12个月时的依从者平均因果效应分析

干预措施中不同组成部分的使用情况也各不相同。总体而言，持续使用率较低，尽管有些人广泛使用了这些资源。在干预组285名具有有效数据的参与者中，237人选择使用在线计算机化认知行为疗法项目（LLTFi），53人选择阅读书籍（8人同时使用了两种方式）。在选择LLTFi的参与者中，204人登录了网站，并完成了七个模块中的中位数为两个（IQR 0–5）。有66名登录网站的参与者未完成第一个模块。98名参与者注册并至少登录了一次大白墙网站。登录中位数为两次（范围1–104），互动（发帖）中位数为零（范围0–49），在网站停留时间为0.30小时（范围0.00–11.17）。

在预先设定的照护过程探索性分析中，干预组参与者在12个月期间的初级保健咨询次数略多于对照组（干预组平均15·4次，标准差11·0；对照组平均14·07, 95% CI 12·5–15·96, p=0·22）。在试验期间接受抗抑郁药处方的参与者比例、抗抑郁药种类或剂量的调整次数，以及随访时正在服用抗抑郁药的参与者数量方面，干预组与对照组之间均无差异（附录第11页）。

在试验过程中，参与者共报告了70起不良事件（常规护理组36起，干预组34起），其中1起与干预相关（因谈论抑郁症导致焦虑加重），但并不严重（附录第12页）。有2例患者死亡（1例死于慢性阻塞性肺疾病，1例死于喉癌），均发生在常规护理组。

讨论

本报告描述了一项关于Healthlines抑郁症服务的大型实用性试验，该服务是一种通过结合多种技术以改善治疗和自我管理、由非专业工作人员提供支持并整合到医疗保健系统中的新型医疗服务模式。该干预措施具有临床有效性，与仅接受常规护理的参与者相比，接受干预加常规护理的参与者在4个月时的治疗反应有所改善，且效应大小显著，需治疗人数为12。此外，与仅接受常规护理的参与者相比，接受干预的参与者报告称焦虑减轻，获得医疗支持与建议的机会增加，对治疗及所获帮助的满意度更高，并在自我管理的态度和技能方面有所提升。

干预的效果在随访4个月时最为显著，随着时间的推移，由于两组情况均有所改善，干预组与常规护理组之间的差异逐渐缩小。在12个月随访后，证据表明干预不再显示出益处，尽管在整个12个月随访期内平均仍存在益处。因此，该干预在抑郁症方面的主要效应是加快了康复速度，这一点仍然很重要。然而，无论是接受干预还是常规护理，达到我们设定的治疗反应标准的参与者仅占少数，且在所有时间点上，两组的平均PHQ‐9 评分均超过10分，提示存在明显的残留症状。值得注意的是，许多参与者在入组试验时已患有严重且持续性抑郁症，大多数正在服用抗抑郁药，并且在试验结束时多数仍存在症状。这些结果表明，许多参与者患有所谓的难治性抑郁症，这并不令人意外，因为长期抑郁症病史和治疗反应不佳的模式在初级保健管理的患者中十分典型。在初级保健中接受抗抑郁药治疗至少6周的患者中，超过四分之三的患者具有临床显著的由于药物效应不足或不耐受、依从性差以及治疗不足等复杂原因导致的残留症状。28这一证据与抑郁症常为一种慢性疾病的观念一致，并表明了改善难治性抑郁症患者治疗所面临的挑战。

难治性抑郁症的管理方案包括更换药物、增加剂量、解决不依从问题或添加心理治疗。该Healthlines干预旨在解决所有这些问题，例如通过促进依从性的策略、提供计算机化认知行为疗法，以及向全科医生发送有关更改药物的指导建议。我们的数据表明，所提出的作用机制仅部分实现，没有证据显示药物依从性得到改善，也没有证据表明全科医生在调整药物方面更为积极。许多参与者仅少量使用了干预的部分内容，只有少数人接受了构成干预核心的完整疗程的电话咨询。然而，一些参与者广泛地参与了该干预，我们的分析表明，对干预的依从性与更高的有效性相关。

因此，该干预措施的主要效应机制可能是来自 Healthlines顾问的支持与激励，以改善自我管理，以及在现有药物治疗基础上增加计算机化认知行为疗法。为了提高干预的有效性，有必要探索改善与初级保健沟通的方式，以优化药物治疗。一旦该干预措施在医疗系统中得到充分建立并实现常规化，相关探索在研究环境之外可能会更容易开展。为了提高患者参与度，预筛可能有助于将干预目标集中在最愿意采用这种方法的人群上。

系统评价6–10的发现表明，针对抑郁症的各种特定远程医疗干预对患者结局具有积极效应，尽管一些研究者指出了证据基础中的方法学局限，包括大量小型可行性研究、评估的结局范围有限以及仅进行短期随访。另一项系统评价8认为网络支持治疗用于抑郁症的证据具有前景但尚不明确。多项关于计算机化认知行为疗法治疗抑郁症的试验取得了积极结果，但这些试验存在局限性，且一项高质量试验显示，在常规电话支持下使用两种计算机化认知行为疗法软件包相较于普通全科医生诊疗并无益处。目前极少开展实用性试验来研究由非临床培训人员实施、整合多种技术与新工作方式的系统层面抑郁症远程医疗干预。本研究有助于填补这一证据空白。

最相似的既往研究是在美国进行的，基于所谓的协作照护模式。照护管理者被提供了一个基于网络的临床决策支持系统，但该干预未使用任何其他远程医疗方法。30在6个月随访时，治疗反应的校正比值比为1·9（95% 置信区间 1·09–3·45），与本项基于英国的 Healthlines试验中4个月时的治疗反应估计值相似（ 1·7，95%置信区间 1·1–2·5）。已有若干关于其他协作照护干预的研究，通常包括个案管理者通过电话进行随访，但并未整合使用互联网或其他远程医疗资源，而这一点正是Healthlines干预的一个显著特征。一项 Cochrane综述31估计，协作照护对抑郁症的短期（0–6个月）治疗反应风险比为1·32（95%置信区间 1·22–1·43），中期（6–12个月）为1·31（95%置信区间 1·17–1·48）。本试验的结果与这些发现相似，但略为更积极（在4个月随访时观察到的校正比值比相当于风险比1·5，95%置信区间 1·1–1·9）。

本试验具有多项优势，包括大样本量、纳入了确诊抑郁症的参与者、保留的参与者比例较高，以及从多个地点进行招募。该研究具有高度实用性，检验了一种基于远程医疗的新型护理方法，该方法可在全国范围内快速且便捷地推广。该干预措施是依据一个基于证据的概念模型精心开发的，这有助于我们探索因果机制，并为开发和评估提供了一个框架。在试验的同时，我们还进行了并行过程和经济评估，相关结果将另行报告。

该研究也存在几项局限性。首先，仅有少数收到试验信息的患者表示有兴趣参与。我们无法针对符合抑郁症严重程度标准的患者群体进行初次邮寄。因此，我们无法确定未回应邀请的人中有多少因不患有抑郁症或不符合严重程度标准而不具备资格，以及有多少人对干预措施不感兴趣或不愿参与本研究。对干预措施缺乏兴趣或使用能力并不一定影响外部有效性，因为我们认识到远程医疗干预并非适合或吸引所有人。然而，如果响应研究邀请的参与者不具备代表性，则研究结果可能无法推广。如果该干预措施被广泛实施，可能会有具有不同特征或抑郁严重程度不同的个体参与，但其益处是否会大于或小于我们观察到的结果则无法确定。招募率低这一问题在其他大型抑郁症初级试验中也较为常见护理，这些试验使用了类似的方法招募患者。28,32 在本试验中，一旦确认合格性后，同意参与的合格个体比例很高（84%）。

另一个局限性是，有较高比例的参与者接受健康顾问的完整会诊次数不足。这一问题在其他抑郁症远程医疗干预中也很常见。9 在本试验中，会诊缺失可能由多种原因造成：一些个体选择不再继续电话呼叫（可能是因为病情已好转），一些人失去联系，另一些人则因 NHS Direct关闭而错过会诊。这些发现或许有助于解释为何当以PHQ‐9评分为基础将治疗反应视为二分类结局时观察到积极益处，而当将PHQ‐9评分作为连续型变量分析时却仅见最小变化。该结果表明，一部分个体从 Healthlines服务中获益，但许多人并未获益，这与以下发现一致：一组个体在仅进行两到三次会诊后便退出服务，而另一组个体完成了整个疗程，并且完成疗程者获得的益处最大。另一个局限性是，尽管总体保留率较高，但干预组与常规护理组之间的保留率存在轻微差异。然而，对缺失的主要结局数据进行多重插补后并未影响研究结果，因此我们认为，失访差异不太可能解释我们的研究结果。

我们的研究结果表明，由非临床培训顾问使用计算机化算法并鼓励人们利用互联网上广泛可用的帮助资源来提供抑郁症的可扩展干预是可行且有效的。这种干预使得在不受临床培训人员数量限制的情况下大幅扩大护理服务成为可能，有助于满足扩大常见心理健康问题服务的迫切需求。尽管该干预在临床结果方面的绝对益处较小，但潜在受益的患者数量非常庞大，且结果已足够有希望，值得进一步开发以提高其可接受性和有效性。未来的研究应探讨基于类似模式的干预对其他慢性疾病的好处。