30、文化胜任型机器人在健康领域的应用与挑战

文化胜任型机器人在健康领域的应用与挑战

在当今社会,机器人技术在健康和社会护理领域的应用日益广泛,尤其是文化胜任型机器人在解决孤独感、提升用户满意度、改善对机器人的态度以及应对重大健康灾难等方面展现出了巨大的潜力。然而,相关研究也存在一些局限性,需要我们谨慎对待研究结果。

机器人对孤独感的影响

孤独感采用ULS - 8孤独量表进行测量。“任意机器人”组、实验组和对照组1的ULS - 8总得分在干预前后显示出孤独严重程度略有降低,而对照组2的参与者孤独得分有所增加。这些结果可以从多个方面进行解读:
- 使用文化胜任型机器人与常规护理相比,不太可能增加孤独感。
- 即使在短时间(2周)内,也可以合理预期孤独感会略有降低。
- 如果这些趋势持续下去,差异可能会变得更加显著。
- 与对照组1使用的机器人相比,实验机器人在减轻孤独严重程度方面并未显示出更显著的效果。
- 需要进一步改进干预措施的深度和影响,以降低孤独感。这可能与增强系统的“社会功能”驱动力有关,使未来系统更注重改善个人的社会资本和环境。

组别 SF36总分T0均值(标准差) SF36总分T2均值(标准差) ULS - 8总分T0均值(标准差) ULS - 8总分T2均值(标准差) 身体健康总分T0均值(标准差) 身体健康总分T2均值(标准差) 心理健康总分T0均值(标准差) 心理健康总分T2均值(标准差)
任意机器人组(N = 23) 58.11(20.79) 54.50(18.28) 75.62(16.81) 73.41(18.99) 16.80(5.13) 15.75(5.28) - -
实验组(N = 12) 57.20(20.36) 53.93(15.21) 77.59(16.40) 78.39(12.15) 14.9(4.98) 14.3(3.53) - -
对照组1(N = 11) 59.09(22.20) 55.12(21.91) 73.47(17.79) 67.97(23.84) 18.8(4.73) 17.2(6.46) - -
对照组2(N = 10) 61.69(27.92) 62.56(30.41) 76.22*(16.51) 63.30*(25.30) 15.70(4.73) 16.50(5.40) - -

注:*P < .05 (Wilcoxon符号秩检验)。SF36得分范围为0 - 100,100代表完美健康;ULS - 8得分范围为8 - 32,32代表严重孤独。

用户满意度和态度

从QUIS总得分和各子量表得分来看,实验组和对照组1的QUIS总得分都相当高,分别为134.42和144.78。得分最高的子量表是“术语和系统信息”,实验组和对照组1的得分分别为12.42和14.81(满分18分),该子量表涉及“平板上消息的位置”和“提示用户输入的平板消息”的清晰度和一致性。“对机器人的总体反应”子量表得分也不错,实验组和对照组1的得分分别为31.17和34(满分45分)。得分最低的子量表是“学习”量表,实验组和对照组1的得分分别为34.25和35.27(满分54分),该量表衡量参与者学习使用机器人、探索其功能和记住各种命令的难易程度。总体而言,干预得到了积极的反馈,参与者对系统的整体使用感到满意,尤其是英国试验组的参与者。

组别 QUIS总分T2均值(标准差) QUIS对机器人的总体反应T2均值(标准差) QUIS机器人上的平板T2均值(标准差) QUIS术语和系统信息T2均值(标准差) QUIS学习T2均值(标准差) QUIS机器人能力T2均值(标准差)
任意机器人组(N = 23) 139.35(27.87) 32.52(8.39) 27.83(5.85) 13.57(3.93) 34.74(10.57) 30.65(5.38)
实验组(N = 12) 134.42(28.62) 31.17(7.25) 25.50(5.87) 12.42(4.58) 34.25(10.86) 31.08(5.50)
对照组1(N = 11) 144.73(27.32) 34.00(9.62) 30.36(4.88) 14.82(2.75) 35.27(10.73) 30.18(5.47)

注:QUIS总分范围为0 - 198,198代表完美满意。

NARS测量结果显示,在基线时,所有组对机器人的态度大多为负面,特别是在“机器人的社会影响”和“与机器人互动时的情绪”子量表方面。然而,除了子量表3(“与机器人互动时的情绪”)变化不大外,各时间点之间的平均得分持续降低,这意味着参与者在继续使用机器人时态度变得更加积极。“任意机器人”组在NARS总得分上的时间点差异具有统计学意义(Z = - 2.297,sig = 0.022)。对照组1在子量表2(“机器人的社会影响”)上也有类似的显著差异(Z = - 2.298,sig = 0.022),实验组接近显著差异(Z = - 1.841,sig = 0.066)。

组别 NARS总分T0均值(标准差) NARS总分T2均值(标准差) NARS S1:对机器人的情况和互动T0均值(标准差) NARS S1:对机器人的情况和互动T2均值(标准差) NARS S2:机器人的社会影响T0均值(标准差) NARS S2:机器人的社会影响T2均值(标准差) NARS S3:与机器人互动时的情绪T0均值(标准差) NARS S3:与机器人互动时的情绪T2均值(标准差)
任意机器人组(N = 23) 42.46*(7.65) 38.70*(8.80) 17.46(5.86) 16.97(6.53) 16.27(3.94) 14.15(4.22) 10.00(2.83) 10.18(3.59)
实验组(N = 12) 41.47(7.83) 38.25(10.10) 15.58(5.05) 14.75(5.40) 15.50(3.68) 13.00(3.67) 10.33(2.53) 10.50(3.34)
对照组1(N = 11) 43.54(7.66) 39.18(7.60) 17.64(5.78) 15.27(7.25) 15.00*(3.55) 12.00*(3.13) 10.91(2.77) 11.91(3.78)
对照组2(N = 10) 46.70(9.30) 47.30(5.33) 19.50(6.67) 21.50(4.95) 18.60(3.98) 17.90(3.60) 8.60(2.95) 7.90(2.60)

注:*P < .05 (Wilcoxon符号秩检验)。NARS总得分范围为14 - 70,70代表高度负面态度。

对文化胜任力的感知

研究的一个关键目标是评估参与者对机器人展示文化胜任力能力的感知。从CCATool总分和各子量表得分来看,在使用1周和2周后,实验组和对照组1使用的机器人总体上被认为具有一定的文化胜任力。实验组和对照组1在T1的总体平均总分分别为20.83和19.45,T2的平均总分分别为22.42和21.27(得分范围0 - 28,28代表最高感知文化胜任力)。在T1和T2,实验机器人在大多数指标上的CCATool得分都高于对照机器人。

组别 CCATool总分T1均值(标准差) CCATool总分T2均值(标准差) CCATool子量表A(文化意识)T1均值(标准差) CCATool子量表A(文化意识)T2均值(标准差) CCATool子量表B(文化知识)T1均值(标准差) CCATool子量表B(文化知识)T2均值(标准差) CCATool子量表C(文化敏感性)T1均值(标准差) CCATool子量表C(文化敏感性)T2均值(标准差) CCATool子量表D(文化胜任力)T1均值(标准差) CCATool子量表D(文化胜任力)T2均值(标准差)
任意机器人组(N = 23) 20.17(4.60) 21.87(3.44) 5.13(1.49) 5.91(1.16) 4.48(1.73) 5.22(1.51) 5.52(1.47) 5.96(0.98) 4.83(1.44) 4.78(1.20)
实验组(N = 12) 20.83(4.84) 22.42(2.91) 5.25(1.54) 6.08(1.08) 4.92(1.73) 5.17(1.19) 5.58(1.88) 6.08(0.90) 4.75(1.42) 5.08(0.79)
对照组1(N = 11) 19.45(4.44) 21.27(4.00) 5.00(1.48) 5.73(1.27) 4.00(1.67) 5.27(1.85) 5.45(0.93) 5.82(1.08) 4.91(1.51) 4.45(1.51)

实验组和对照组1在T2时都认为机器人比T1时更具文化胜任力,尽管实验组的得分总体上有更大的提高,但这种提高的差异没有统计学意义。这意味着第1周后对系统进行的增加文化胜任力的更改(例如,实现针对个人文化价值观的个性化设置)对文化胜任力的感知产生了积极影响,并且如预期的那样,对实验机器人的影响更大。另一种可能的解释是,随着时间的推移,参与者对系统的使用理解不断加深,导致得分增加。当然,也可能是这两种解释共同导致了这些差异。

鉴于实验组和对照组1的参与者在T1时总体上成功感知到了文化胜任力,这证实了无需用户个性化设置也能体验到机器人文化胜任力的理论,同时否定了文化胜任力和用户个性化设置是相同概念的理论。然而,由于在实施个性化设置1周后的T2时,文化胜任力的感知水平略有提高,可以得出结论,针对个人价值观和偏好的个性化设置可以进一步改善体验。因此,总体而言,文化胜任力和用户个性化设置的概念并非同质,而是相互补充的。

研究局限性

尽管该试验是同类试验中最严格、最复杂和规模最大的之一,但样本量没有达到统计学要求且相对较小,这降低了分析的可靠性和深度。因此,观察到了较大的标准差、组间差异的不一致同质性以及一般非正态的数据分布,尽管通过使用非参数推断测试部分解决了后一个问题。此外,尽管尽最大努力控制了关键的潜在混杂变量,并采用了分层随机分组(按性别),但可能仍存在一些混杂变量。因此,对统计结果的任何解释,包括进行更广泛的概括,都应谨慎对待。

参与者在定性访谈中还指出了其他一些潜在的偏差。例如,实验组和对照组的参与者意识到自己被研究人员进行音频和视频监控,这可能抑制了他们与机器人的一些对话和互动。这是在试验设计时就已考虑到但无法避免的偏差,因为监控参与者以确保他们的安全并在出现技术问题时进行干预是至关重要的。

观察到的技术问题也是一个潜在的偏差。然而,通过对记录问题的分析,使用“技术问题量表”进行测量,没有发现技术问题影响试验结果的证据。建议未来类似的试验应采用本研究中开发的技术问题量表,以测量技术问题的程度和严重性以及所采取的干预措施,从而评估技术问题对结果的总体统计影响。

实验组和对照组1的试验参与者在2周的测试期间因研究团队的培训和支持而有额外的人际接触,这可能是另一个潜在的偏差。虽然这种额外接触在两组之间得到了控制,但这意味着对照组2的参与者接触较少。这一点在之前也已考虑并尽可能进行了管理,但机器人组和对照组2之间的差异无法避免。

语音识别的局限性也是一个问题。参与者在定性访谈中多次提到这一限制,它对干预的整体效果产生了明显的负面影响。不幸的是,在试验过程中无法解决这个问题。例如,Pepper机器人的车载麦克风位于头部顶部,对于经常坐着或躺着与Pepper交谈的体弱老年人来说,这个位置并不有效,而且麦克风的灵敏度也无法提高,导致语音碎片化、音量较低的老年人的话语往往无法被机器人有效理解。

干预持续时间仅为2周,可能被认为太短,需要更多时间才能产生有意义的效果。虽然延长时间可能是理想的选择,但这样做会减少总体样本量,而样本量是组间和组内分析的优先考虑因素。为了获得更丰富的数据集,进行更多参与者的更多测试会更有利,但这将带来巨大的成本和资源影响,包括更多的时间、机器人、研究人员以及更多来自英国和日本的养老院招募对象。此外,机器人能够使用印度语言进行对话可能会有益,但这也需要额外的费用和资源。考虑到印度参与者位于英国,使用英语与机器人对话的要求并非重大限制(实际上,能够说英语是入选的必要条件)。

最后,需要提醒的是,该试验的结果基于特定类型的人群,即居住在护理机构中没有严重痴呆、严重心理健康问题或严重体弱(需要住院治疗)的老年人。参与者在认知和身体上都能够在2周内理解并与机器人互动。因此,基于当前系统对其他人群的干预潜在影响进行推断时应谨慎,特别是患有更严重痴呆和体弱的老年人。

文化胜任型机器人在重大健康灾难中的角色

重大健康灾难概述

联合国将重大灾难定义为“对社区或社会的正常运作造成严重破坏,涉及广泛的人员、物质、经济或环境损失和影响,超出受影响社区或社会自身应对能力”的事件。各类灾难对公共卫生和受灾人群的医疗系统产生了巨大影响,包括医疗设施的破坏、基本药品和医疗设备的急剧减少、医护人员的流失,还可能引发传染病爆发、营养不良以及心理健康和社会心理问题。

从20世纪60年代开始,联合国致力于预防和减少重大灾难对受灾人群的不利影响。早期的灾难管理侧重于准备和响应,对风险降低和灾后恢复重视不足。2005 - 2015年的《兵库行动框架》带来了国际范式的转变,从有限的紧急行动转向更全面的灾难管理方法。当前的《仙台减灾框架(2015 - 2030)》进一步强调了采用广泛的灾难风险管理方法和加强与健康相关的减灾工作的必要性,世界卫生组织也认可了全灾种和全健康方法在卫生部门灾难管理中的重要性。

文化胜任型机器人在重大健康灾难中的作用

在重大健康灾难(MHDs)中,对健康和社会护理(HSC)的需求急剧增加,机器人的实用性得到了极大提升,它们可以在拯救生命方面提供宝贵的帮助。不同类型的机器人可以发挥不同的功能,例如:
- 连接人员与手术 :在紧急情况下,机器人可以协助实现远程手术操作,使患者能够及时获得专业的医疗救治。
- 环境消毒与清洁 :对临床环境进行消毒和清洁,减少交叉感染的风险,保护医护人员和患者的安全。
- 信息提供 :为患者和医护人员提供相关的医疗信息和指导,提高应对灾难的效率和效果。
- 物资运输 :承担物资的运输任务,确保医疗用品和生活物资能够及时送达需要的地方。

以下是机器人在重大健康灾难中发挥作用的流程图:

graph LR
    A[重大健康灾难] --> B[健康和社会护理需求增加]
    B --> C[机器人发挥作用]
    C --> C1[连接人员与手术]
    C --> C2[环境消毒与清洁]
    C --> C3[信息提供]
    C --> C4[物资运输]
以COVID - 19大流行为例

COVID - 19大流行可以作为一个实际案例,展示社会辅助机器人(SARs)和其他人工智能设备在HSC领域的实际应用和潜力:
1. 实际应用和有用性 :在COVID - 19大流行期间,SARs和其他机器人设备在HSC部门得到了实际应用,如在医院中协助进行患者监测、物资配送等工作,提高了工作效率,减少了医护人员与患者的直接接触,降低了感染风险。
2. 潜在贡献 :文化胜任型SARs和其他人工智能设备在急性医院环境和养老院等HSC应用领域具有巨大的潜力。它们可以帮助减少HSC工作人员感染COVID - 19的风险,同时提供高质量的整体护理。
3. 提供陪伴和关怀 :在社交距离限制的情况下,机器人不受此影响,可以为医院患者和老年人提供陪伴,给予他们全面的精神关怀。
4. 识别和考虑技术限制 :尽管人工智能技术具有很大的潜力,但也存在一些限制,如语音识别不准确、应对复杂情况的能力有限等。政府在面对MHDs时,需要认识到这些限制,并采取相应的措施来应对。

对未来研究和应用的建议

为了更好地发挥文化胜任型机器人在健康领域的作用,未来的研究和应用可以从以下几个方面入手:
1. 扩大样本量和研究范围 :进行更大规模的研究,以提高研究结果的可靠性和普遍性,更好地了解机器人在不同人群和场景中的效果。
2. 改进技术和功能 :针对当前存在的技术问题,如语音识别、个性化设置等,进行改进和优化,提高机器人的性能和用户体验。
3. 加强跨学科合作 :促进社会和医疗保健专业人员、机器人专家、患者、公共卫生专家、政治家以及文化、跨文化健康、跨文化伦理和医疗保健系统等领域的专家之间的合作,共同设计和开发更符合需求的机器人。
4. 制定相关政策和规范 :政府和相关机构应制定相应的政策和规范,确保机器人的安全、可靠和文化适应性,同时保障用户的权益和隐私。
5. 开展培训和教育 :对HSC专业人员进行培训,使他们能够熟练使用机器人,并充分发挥其在灾难应对中的作用。

总之,文化胜任型机器人在解决孤独感、提升用户满意度、改善对机器人的态度以及应对重大健康灾难等方面具有巨大的潜力。然而,目前的研究还存在一些局限性,需要进一步的研究和改进。通过不断努力,我们有望更好地利用机器人技术,为健康和社会护理领域带来更多的福祉。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值