社交媒体看医疗服务认知

公众对医疗服务的认知:来自中国社交媒体平台的证据

摘要

社交媒体已被越来越多地用作健康相关研究的数据资源。本研究旨在识别与中国医疗服务相关的社交媒体记录的内容量和情感极性。研究使用一组医疗服务关键词,从2017年6月至2017年9月期间的微信和QQ空间提取数据。这些数据被纳入一个语料库,并利用腾讯自然语言处理(NLP)进行内容分析。最终语料库包含约2900万条记录。其中,患者安全是提及频率最高的主题(约873万条,占语料库的30.1%),而人文关怀相关内容获得的社交媒体引用最少(43万条,1.5%)。情感分析显示,正面、中性和负面情绪分别占36.1%、16.4%和47.4%。医患关系类别的负面内容比例最高(74.9%),其次是服务效率(59.5%)和护理服务(53.0%)。预约挂号服务相关内容中,中性倾向占比最高(30.4%)。本研究为公众对中国医院医疗服务认知的程度和方向提供了证据,并表明可利用社交媒体中 readily available 的数据监测医疗服务改进的可能性。

关键词 :医疗保健;社交媒体;中国;微信;QQ空间;自然语言处理

引言

从不同角度调查公众对医疗服务的认知可能会产生不一致的结果。例如,患者对医疗质量不满而导致的针对医护人员的暴力事件[1–6],以及医患关系紧张的情况在中文媒体报道中广泛存在。而国家级的患者体验调查显示,患者总体上对住院和门诊服务均较为满意[9]。这种差异可能源于调查和媒体报道中存在的偏倚;然而,这种不一致也表明需要额外的数据来源来监测公众对中文医疗服务的公众意见。

有研究指出,社交媒体或许可以成为这样一种数据来源。Rozenblum等人指出,当以患者为中心的医疗保健、互联网和社交媒体相结合时,医疗服务提供者与消费者之间的现有关系可能会面临重大变革——从而形成一场“完美风暴”[10]。社交媒体平台上的用户帖子将产生大量关于公共或私人议题的实时数据,其中散布着医疗保健相关信息。因此,利用社交媒体数据开展医疗研究已成为一个迅速发展的领域,并已涵盖多个医学和医疗研究领域[11,12]。Sinnenberg及其同事提出了在医疗研究中使用社交媒体数据的四种方式:

(1)内容分析,(2)特定主题内容的数量监测,(3)用户与他人的互动情况,以及(4)用户网络分析[12]。在内容分析方面,大多数研究集中于测量公众对特定疾病的讨论[13–15],针对医疗干预措施(如癌症筛查)的情感分析[16,17],识别健康消费者中的安全问题[18],检测健康产品的不良事件[19,20]。一些研究人员基于中国在线健康社区中患者发布的评论研究了患者体验[21,22],但很少有研究利用社交媒体数据收集与医疗服务相关主题的信息。同时,尽管情感分析已被广泛应用于处理与健康相关文本的用户情感[23],但为中文语言健康相关情感分析设计的词典资源和工具仍十分稀缺。随着技术和经济的快速发展,中国的社交媒体用户及其活动显著增加,使社交媒体成为医疗服务监测的有前景的数据来源。在中国,互联网普及率在2017年末达到55.8%,本地服务商主导市场,而Facebook和Twitter因无法在中国访问而未占据主流。中国社交媒体网站具有独特的格局,它们不仅可用作通信软件,还可作为信息入口。作为总部位于中国深圳的腾讯控股有限公司的子公司,微信和QQ空间是两个领先的社交媒体和社交网络服务平台。在2017年第一季度,两者的月活跃用户账户分别超过9.38亿和6.32亿。根据2016年微信数据报告,微信的典型用户出生于80后或90后[26],代表了中国广泛的人口统计群体。除了提供多媒体通信和支持社交网络外,微信还设有“公众号”,作为向公众发布文章的渠道。任何个人或组织均可申请自己的公众号,以传播其观点和理念。至于QQ空间,它是与中国流行的在线即时通讯应用QQ捆绑的平台。QQ空间允许用户创建自己的个人页面,撰写博客并发布动态。用户可以在社交媒体平台上自由且即时地表达个人观点和态度。根据用户同意的平台服务条款和隐私政策[27,28],平台收集、存储和使用三类信息:(1)个人信息;(2)非个人信息;以及(3)共享信息。共享信息指用户自愿在平台上自由且即时分享的信息,从而为收集公众对医疗服务的意见提供了宝贵的视角和机会。

因此,我们选择微信和QQ空间作为社交媒体平台开展此项探索性研究。本研究旨在基于提取的关于医院医疗服务的社交媒体内容进行量值与情感分析。该研究能够展示社交媒体用户对医院医疗的看法,并可能为中国将社交媒体作为医疗研究数据来源的进一步利用提供启示。

2. 材料和方法

2.1. 研究设计

本研究分为三个阶段。首先,我们利用预定义的医疗服务类别列表制定关键词和检索策略。然后使用该数据检索策略从原始数据库中提取内容,该数据库包含微信和QQ空间的公开帖子。提取的材料随后被纳入语料库。其次,我们应用腾讯NLP平台的自然语言处理(NLP)技术对语料库进行处理,并计算与不同医疗服务主题相关的内容量。第三,我们进行了情感分析,以探讨中国社交媒体用户在不同医疗服务主题上的情感极性。数据收集与分析的详细过程见图1。本研究方案已获北京协和医学院公共卫生学院伦理委员会批准(71532014),并在北京协和医学院与腾讯之间的学术合作项目下开展。

示意图0

2.2. 数据来源

本研究使用的原始数据库来自仅在中国大陆运营的微信和QQ空间版本。这两个平台的用户数量和数据纳入标准见表1。从2017年6月至2017年9月,从这两个平台收集了由个人用户自愿分享的公开发布的博客、评论和文章等信息。数据收集遵循腾讯用户的隐私政策,并受平台实施的保密和安全措施约束。数据分析由腾讯的技术人员提供支持。

表1. 数据来源

平台 上线时间 月活跃用户账户数(2017年第一季度) 用户数据纳入标准
微信 2011 9.38亿 官方订阅账号的帖子 用户发布的账号
Qzone 2005 6.32亿 个人用户公开发布的博客和日记

2.3. 医疗服务类别

本研究使用的九项医疗服务类别源自国家医疗服务改进计划(2015–2017),该计划由原中华人民共和国国家卫生和计划生育委员会(NHFPC)制定,旨在改善以患者为中心的医疗保健服务和全国范围内的患者体验[29]。该计划在NHFPC医政管理局的领导下实施[30],建议我们采用九个预定义类别来反映医院中的医疗服务(见表2)。

表2. 国民健康服务二期(NHSII)2015–2017年中的医疗服务类别及相应描述

医疗服务类别 国民健康服务二期的目标
服务环境 优化设施布局,营造友好的服务环境
预约挂号服务 促进临床预约服务的利用并引导患者流动
服务效率 通过合理分配资源提高服务效率和效果
信息技术 利用信息技术改善患者体验
住院服务 推动住院服务流程再造,提供整合型医疗保健服务
护理服务 持续提高护理质量,加强护理队伍建设
患者安全 通过推广标准操作规程的实施来确保患者安全
人文关怀 加强人文关怀,提供医务社会工作服务
医患关系 和谐医患关系,减少医疗纠纷

2.4. 检索策略与语料库构建

在本研究中,我们基于社交媒体数据源构建了中文医疗服务语料库,以支持进一步的分析。首先,我们根据预定义服务主题构建了关键词和术语的词典。例如,本研究中用于“信息技术”的词典指的是医院基于信息技术提供的新信息传播渠道,以改善患者在服务信息获取方面的体验。该词典包含六个信息技术服务相关术语,即“微博”、“微信”、“网站”以及“自助机”。其次,我们制定了一套检索策略,依据各主题对应的词典从两个数据来源中提取相关数据。每个类别的完整搜索词列表及其对应的检索策略详见补充表S1。最后,我们将检索策略应用于公开发布材料的数据库,筛选与医疗服务类别相关的帖子以构建语料库。搜索和筛选过程由腾讯云完成。

2.5. 分析医疗服务的社交媒体内容

基于医疗服务语料库,我们将内容分类到预定义的不同医疗服务主题中,并测量了各主题的内容量。具体而言,我们使用腾讯自然语言处理提供的开放应用程序编程接口(OpenAPI)服务来分析检索到的内容。这是一个基于并行计算和分布式爬虫系统的中文自然语言处理开放平台[31]。这些服务使我们能够将评论和博客拆分为句子,并对每个句子进行过滤,以判断其是否包含目标服务主题的关键词和术语。如果包含特定关键词和术语的句子属于表S1中所列的相应医疗服务类别,则将其归入某一类别。通过统计语料库中各服务主题关键词在句子数量上的出现次数,我们可以汇总各主题层面的数量,并计算社交媒体语料库中不同主题的比例。对于中文情感分析工具,我们也选择了腾讯自然语言处理,因为其算法是基于数千亿条中文互联网语料数据训练而成,并已成功应用于其他腾讯产品(https://nlp.qq.com)。腾讯自然语言处理的开放应用程序编程接口具备中文批量文本自动摘要和情感分析功能,使我们能够将社交媒体语料库中特定主题的句子分类为情感极性类别(即中性、正面和负面)。最终,每句话都被标注并分类到不同的情感极性中。

3. 结果

3.1. 内容量

社交媒体语料库包含约2900万条来自微信和QQ空间的记录,涵盖与医院医疗服务相关的9个预定义类别。

表3展示了各社交媒体平台上医疗服务主题的内容量 。在关于医疗服务主题的社交媒体内容中,患者安全是微信和QQ空间上最常见的主题。与患者安全相关的内容量约为873万条,占整个语料库的30.1%。其他主题的内容在语料库中所占比例分别为:信息技术(22.2%)、服务效率(17.9%)、服务环境(10.3%)、住院服务(9.6%)、预约挂号服务(3.4%)、护理服务(2.5%)、医患关系(2.5%)和人文关怀(1.5%)。

表3. 各主题内容量(数量及比例)分布,2017年6月15日至2017年9月15日

医疗服务主题 微信 (N= 15,172,421) QQ空间 (N= 13,844,634) 总计 (N= 29,017,055)
数量 % 数量 % 数量 %
患者安全 4,020,928 26.5% 4,704,284 34.0% 8,725,212 30.1%
信息技术 3,598,566 23.7% 2,857,266 20.6% 6,455,832 22.2%
服务效率 2,491,950 16.4% 2,703,352 19.5% 5,195,302 17.9%
服务环境 1,902,727 12.5% 1,075,697 7.8% 2,978,424 10.3%
住院服务 1,392,611 9.2% 1,396,209 10.1% 2,788,820 9.6%
预约挂号服务 641,865 4.2% 353,856 2.6% 995,721 3.4%
护理服务 424,229 2.8% 303,034 2.2% 727,263 2.5%
医患关系 438,823 2.9% 276,865 2.0% 715,688 2.5%
人文关怀 260,722 1.7% 174,071 1.3% 434,793 1.5%

3.2. 情感分析

对语料库内容进行情感分析的结果发现,在全部九个医疗服务主题中,语料库中有36.1%的内容被识别为具有正面倾向,16.4%为中性,47.4%为负面。我们发现,正面内容占比最高的主题是服务环境(59.6%),其次是患者安全(53.2%)。关于包含负面内容多于正面内容,其中医患关系占比最高(74.9%),其次是服务效率(59.5%)和护理服务(53.0%)。值得注意的是,预约挂号服务中有超过三分之一的内容(30.4%)呈现出中性倾向。

此外,与九个主题的内容数量分布相比,相应医疗服务主题的内容情感倾向显示出差异。例如,表3显示,在语料库中,护理服务和医患关系的主题内容占比相同(2.5%),然而,我们在图2中观察到社交媒体用户对这两个主题的内容情感倾向有所不同。

示意图1

4. 讨论

据我们所知,这是首次尝试利用中文社交媒体平台上的公开发布材料来探讨公众对医疗服务认知的研究。研究结果显示,患者安全是中文社交媒体平台用户最关注的话题,其次是信息技术和服务效率。服务环境的正面评论比例最高。
该研究评估了内容量计算和情感分析在中文社交媒体数据中的应用。这项研究是探索利用中国社交媒体数据的方法论的关键一步,也是通过分析独特数据来源来追踪公众对医疗服务看法的早期尝试。
本研究发现大量与信息技术和服务效率相关的内容,这可能反映了中国政府和医院在将信息技术融入中国医疗服务方面所做的一系列努力。一些研究人员指出,医疗卫生信息技术服务被用于改善患者体验[32–34],并作为缩短中国公立医院漫长等待时间的潜在解决方案[22,35–37]。
人文关怀是本研究语料库中提及最少的话题。这可能表明中国社交媒体用户对人文关怀这一概念并不十分熟悉。发表相关帖子的用户基本持正面态度。另一种解释可能是,这种关怀尚未普及到公众,仅少数人体验过。未来可开展进一步的实证研究或对照研究,以提供更深入的见解。
我们的研究还探讨了社交媒体内容对医疗服务的情感倾向:47.4%提供了负面反馈。尽管这只是初步结果,但可能已足以引起医疗机构和政策制定者的高度警觉。尽管在中国患者调查通常显示积极的结果[9],但在社交媒体平台上仍存在大量负面评论。有必要进一步采用更详细的方法论来深入理解这些负面评论。
在本研究调查的9个主题中,我们发现各主题的负面反馈以及内容数量存在巨大差异。例如,与医患关系相关的内容在语料库中仅占2.5%,但其中74.9%的内容表现出负面反馈。不同主题的情感极性分布可能对中国医疗改革具有重要的政策意义。例如,关于预约挂号服务的社交媒体提及中有30.4%反映了中性反馈,这可能表明公众对该新型服务仍存在不确定性。患者尚未熟悉这些服务——尽管该服务旨在提高患者便利性和医院效率。此类反馈对于医院通过加强患者教育来提升服务质量至关重要。进一步研究可以关注那些负面帖子中具体讨论的内容,以便医院和相关管理人员采取针对性措施改善服务。
与之前的证据一致[11,12],我们的结果表明,社交媒体可以作为中国以及英语国家健康研究的有用工具,并可用于捕捉公众对医疗服务的看法[23,38]。然而,社交媒体上最受关注的医疗保健问题似乎与患者调查中的发现有所不同。最近一项定性研究的发现显示,患者最关心的是医院环境和设施[39],而在我们的研究中,患者安全问题的讨论量最大。另一项研究考察了中国的在线医生评价,结果显示大多数帖子对医生表达了正面态度[21]。尽管关于这些问题的证据尚无定论,但这可能表明普通公众与患者之间存在认知差异。

5. 优势与局限性

我们的研究将自然语言处理技术应用于分析中国社交媒体平台中与医疗服务相关的内容,为了解中国医院的医疗服务提供了新的视角。研究结果将有助于医疗服务提供者和监管机构在以患者为中心的医疗服务方面进行绩效基准评估。这一点非常重要,因为社交媒体已被视为中国网民获取健康信息的重要渠道,社交媒体的视角可以作为传统纸质调查结果之外的补充,帮助理解消费者对医院医疗服务的观点。
本研究存在以下局限性。首先,由于原始材料为用户生成数据,选择偏差可能影响了数据。例如,观察发现大多数社交媒体用户出生于80年代或90后[26],然而,由于腾讯当前的用户隐私政策禁止此类行为,我们无法详细描述用户的社会人口学信息。此外,考虑到研究的探索性质,本研究仅关注微信和QQ空间作为数据来源,而中国的其他社交媒体平台也可能具有开展此类分析的潜力。
其次,由于我们是基于国民健康服务二期的政府文件和专家咨询得出的医疗服务类别和词典,因此本研究的语料库可能未能包含一定数量与医疗服务相关的数据。这可能导致我们低估了这两个社交媒体平台上医疗服务相关内容的容量。此外,尽管数据库中的所有材料均为中文,因此很可能由来自中国的用户生成,但我们目前无法确定包含医疗服务关键词的帖子是在描述中国的医疗保健系统,还是在讨论国外的医疗保健系统。
使用中文。进一步研究可能会致力于开发检索策略,以实现这种区分并提高结果的特异性。
第三,尽管消费者健康词汇(CHV)是检索目标数据的金标准参考,且已在先前的研究中使用[13,38],但此类开源的词汇表及其对应的词典在中文中尚不可用。本研究情感分析的准确性与可信度仍有待进一步验证;然而,这需要采用一种针对中文语言的情感分析替代方法,并探讨将此类方法应用于腾讯数据的可能性,这些数据虽为公开发布的内容,但仍受严格的使用条款限制。另一项局限在于,我们无法确认腾讯提供的数据是否完全代表所有用户的数据,因为平台可能存在未公开记录的关键词过滤器。这将带来潜在偏差,并限制本研究发现的可推广性。

6. 进一步研究

微博是另一个流行的中国社交媒体平台,被认为是中国版的Twitter。未来的研究可以考虑将分析过程扩展到微博的内容,以进一步探索本研究未涵盖的用户及其观点。
定量方法,如我们研究所示,以及定性方法,如面对面个体访谈法,都有助于更好地理解医疗服务中的消费者关怀。目前,针对后一问题的实证研究还十分匮乏。已有建议提出应补充公众对医疗服务的观点[39]。
此外,消费者在社交媒体上对医疗服务提供者的非邀请式评论的普及性为了解患者体验提供了重要途径,并已在先前的研究中得到证实[38,41–44]。未来基于医院层面的社交媒体数据来衡量患者体验的研究将有助于更好地理解中国的医疗质量状况。

7. 结论

通过分析来自微信和QQ空间的共享信息,本研究发现患者安全是中文社交媒体平台用户最关注的话题,其次是信息技术和服务效率,而医患关系则呈现出负面评论比例最高。本研究探讨了利用社交媒体监测公众对医疗服务认知的可能性。研究发现提供了关于医疗服务公众认知的总体概述,可帮助监管机构在国家或地区层面建立基准,以监测比较区域和服务领域之间医疗改善进展的情况。这也是对传统的纸质消费者调查的必要补充。社交媒体认知与传统消费者调查结果之间的潜在差异,将有助于监管机构从不同角度更好地理解护理服务质量的差距。进一步研究还可聚焦于将自然语言处理方法扩展到更广泛的基于内容的资源,以深化我们对公众在医疗服务方面大众意见的理解。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值