基于个性化与联邦学习的人类活动识别模型研究
基于FID的人类活动识别个性化模型
在人类活动识别(HAR)中,当大规模数据集不可用时,精心选择最有效的训练数据来构建活动识别模型可能比简单地使用整个数据集更有益。研究人员提出了基于分布匹配指标(FID分数)来选择与目标相关的训练用户样本的算法。
最近FID邻居方法
- 子采样与模型选择 :从子采样数据中,研究人员开发了k最近FID邻居子集(k = 3 - 5),并选择性能最佳的模型。对于每个p%的子采样,他们汇总了500次实验的结果以确保统计显著性。
- 实验结果 :对于DG、Wetlab和Mobiactv2数据集,随着测试用户数据的增加,FID和F1分数的置信区间都减小。随着p%的增加,测试用户与所选社区之间的FID分数降低,测试用户预测的F1分数增加。这直观地表明,当有更多测试用户样本时,该方法更有可能找到正确的社区。更重要的是,只要有0.5%的测试用户样本可用,子集模型在所有数据集上的表现都优于全局模型。例如,在DG和Wetlab数据集中,0.5%的测试用户样本相当于15秒;在Mobiactv2数据集中,相当于10秒。这一结果令人鼓舞,因为从新用户那里获取不到一分钟的数据就足以检测与测试用户相关的社区。
| 数据集 | 0.5%测试用户样本时长 |
|---|---|
| DG | 15秒 |
超级会员免费看
订阅专栏 解锁全文

893

被折叠的 条评论
为什么被折叠?



