Cartel:边缘协同迁移学习系统
1. 数据更新策略
在边缘计算环境中,数据更新策略对于系统性能至关重要。有间隔更新和阈值更新两种策略。
- 间隔更新 :每 m 个批次进行一次更新,可减少数据传输,但会导致元数据服务(MdS)处的数据陈旧。例如,边缘节点的模型性能可能近期下降,但 MdS 在选择逻辑邻居时却不知情。若添加额外验证步骤可解决此问题,但会延迟协作过程。
- 阈值更新 :边缘节点仅在元数据变化超过用户定义的阈值时才发送更新。这种策略能减少数据传输,避免信息陈旧,但需要额外设置阈值。在评估 Cartel 时,主要使用常规更新策略,因为它能为 Cartel 必须传输的元数据量提供上限。不过,阈值更新策略也有其优势,后续会进一步探讨。
与 Gaia 相比,Gaia 采用阈值更新方法,但它专注于新的机器学习同步模型,改善发送模型更新的节点间通信。对于更新大小较小的模型有益,但应用于内存消耗大的模型(如 ORF)时,数据传输量会增加。而且,Gaia 的目标是构建地理分布式通用模型,而 Cartel 支持每个节点的定制模型,仅在观察到变化时才寻求更新。
2. Cartel 的三个关键机制
2.1 漂移检测
数据集的变化会导致机器学习模型的预测性能下降。漂移检测机制的目标是快速提升发生数据集漂移的节点上模型的性能。在 Cartel 中,仅对负漂移(即模型错误率随时间增加)采取行动。
为便于说明,采用基于阈值的漂移检测机制,需要用户指定常驻模型错误率的硬限制 L(L ∈[0, 1])。基于 L 和窗口大小 W 两个参数,每
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



