云计算与医疗健康:技术架构、成本考量与案例分析
1. 联邦学习架构与混合模式方案
1.1 联邦学习的基本情况
联邦学习有集中式和分布式两种实现方式。在大型程序二进制文件的情况下,分布式解决方案的运行时间可能更高,通常联邦学习的训练时间比集中式学习长。集中式实现是将共享数据集中收集并在中心位置进行分析;分布式则是数据保持分布,分析(共享代码和神经网络权重)在不同位置间移动,且集中式实现的性能通常优于分布式。在进行可扩展性决策时,还需考虑安全性。
1.2 混合模式联邦学习架构(MFL)
传统的集中式和分布式方法各有优缺点,分布式虽能克服集中式的一些局限,但存在信任要求,且有更高的延迟和多周期训练推理的问题。因此,提出了混合模式联邦学习(MFL),它结合了集中式数据共享AI系统和联邦学习系统的优点。
MFL将数据分为私有和公共两部分。在医疗领域,私有数据可用于识别患者,可将其替换为只有拥有方知道的ID,约90%的数据可在其他公共数据库中找到,能安全共享。例如在社交平台上,人们分享工作细节等信息,但不分享社保号或个人薪资信息。这种模式能在不传输敏感代码导致不可接受延迟的情况下进行有意义的计算,贡献方还可进行公共ID到私有信息的反向映射。
在医疗场景中,MFL可使医院通过比较匿名患者与其他医院的类似病例,为重症患者提供个性化治疗,也能为制药和学术研究人员提供有价值的数据,催生新的治疗方法。然而,MFL也面临以下挑战:
1. 本地和全局模型 :在MFL训练中,每个客户端有其局部特征的本地数据。推理时,输入数据可能只有这些特征,也可能更多甚至是全特征。前者客户端自行推理,后者则依
超级会员免费看
订阅专栏 解锁全文
747

被折叠的 条评论
为什么被折叠?



