移动健康中的迁移学习:解决活动识别挑战
1. 引言
可穿戴传感器技术与先进计算算法的快速融合,为无处不在的客观监测应用创造了独特机遇,这些应用几乎影响着现代生活的方方面面。移动健康应用是一个具有巨大潜力、能改善人们生活质量的热门领域,例如远程健康监测、长期健身追踪和跌倒检测等。而利用机器学习技术进行活动识别,是支持这些应用的核心任务。
然而,基于传感器的活动识别系统在日常生活场景中的可扩展性面临挑战,主要原因如下:
- 跨用户差异 :使用实验室环境中收集的传感器数据训练的机器学习模型,不一定能代表未知用户的运动模式。当系统被新用户采用时,活动识别算法的性能最多可下降 63.7%。
- 空间不确定性 :指两个传感平台之间的“硬件引起的不确定性”和/或“软件引起的不确定性”。前者包括因硬件差异导致的跨平台变化,后者包括设备软件配置的差异。实验表明,当使用在一款智能手表上训练的活动识别模型,来检测另一款不同型号智能手表观察到的活动时,准确率下降 60.3%。
- 对标记训练数据的依赖 :传统机器学习算法依赖大量标记的训练数据来获得可靠的模型。但手动标注传感器数据是一个昂贵的过程,已被视为个性化运动分析的主要障碍,因此在每个新环境中标记传感器数据是不可行的。
个人移动设备的普及,给活动识别算法的泛化性带来了新挑战,主要是由于各种消费平台之间存在空间不确定性。例如,用户用新的同型号或不同型号移动设备(如智能手机)替换或升级旧设备时,希望继续使用旧设备上安装的运动分析应用,该应用有训练良好且准确的活动识别模型,但用户不想为新设备上的模型重新训练提供额