特征平台
一、背景
各推荐业务都有相应的特征需求。
特征的生产、上线的质量和效率直接决定了策略和模型的质量和迭代速度。
为了使策略和模型在实际业务场景中发挥更大的效益,需要建设一个好的特征生产和上线的平台。
二、方案设计
1、设计思路
- 通过实现实时特征预处理配置化、实时特征计算配置化、特征组配置化,实现常规特征1小时内上线
- 通过构件离线特征公共基础表、实时特征公共基础表,实现基础特征的复用
- 开发了通用的Count、Sum、List、Set、Max、Min等等特征算子,常规特征无需开发
- 将数据预处理、特征计算、特征更新、特征使用、特征组使用等各阶段数据上报cat,并配置相应告警,实现特征质量的监控与告警
2、设计图




3、核心代码
该博客介绍了特征平台的设计方案,旨在提升推荐业务中特征的生产和上线效率。通过配置化实时和离线特征预处理、计算以及特征组,实现了1小时内上线常规特征。平台提供基础特征复用、通用特征算子,并具备全面的数据质量监控和告警系统。核心代码可在提供的GitHub链接中查看。
720

被折叠的 条评论
为什么被折叠?



