特征平台

该博客介绍了特征平台的设计方案,旨在提升推荐业务中特征的生产和上线效率。通过配置化实时和离线特征预处理、计算以及特征组,实现了1小时内上线常规特征。平台提供基础特征复用、通用特征算子,并具备全面的数据质量监控和告警系统。核心代码可在提供的GitHub链接中查看。

特征平台

一、背景

各推荐业务都有相应的特征需求。

特征的生产、上线的质量和效率直接决定了策略和模型的质量和迭代速度。

为了使策略和模型在实际业务场景中发挥更大的效益,需要建设一个好的特征生产和上线的平台。

二、方案设计

1、设计思路

  1. 通过实现实时特征预处理配置化、实时特征计算配置化、特征组配置化,实现常规特征1小时内上线
  2. 通过构件离线特征公共基础表、实时特征公共基础表,实现基础特征的复用
  3. 开发了通用的CountSumListSetMaxMin等等特征算子,常规特征无需开发
  4. 将数据预处理、特征计算、特征更新、特征使用、特征组使用等各阶段数据上报cat,并配置相应告警,实现特征质量的监控与告警

 

2、设计图

 

 

 

3、核心代码

https://github.com/ZuoYiGeYouMuBiaoDeRen/feature-platform

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值