- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 推荐系统策略灵活性的设计
一套好的配置化的方案是极其必要的,而该方案主要应该针对每一层去抽象实现每一层的变量,这些变更可以进行配置化变更,从而可以极大的提升策略迭代和策略变更的效率。2.1 召回层对应粒度就是不同的召回队列,含向量召回,kv召回(热点队列,个性化队列)等等,另外有一些定向用户群体的场景,比如基于人群包等等进行召回。1 ABTesting:不同分层的ab 测试,如召回层,过滤层,粗排层(不同模型),精排层(不同模型),重排层,规则层等做abtest,每一层支持正交实验。2 每一层会有定制化的策略。
2024-05-22 16:14:43
319
原创 向量检索引擎架构
有个比较大的弊端,如果运行在gpu上,存储海量的向量数据和基础标量数据会占据较大的空间。从架构上看,本质上类似于elasticsearch + faiss 的组合,es 运行在cpu(通过倒排索引加速filter,极佳设计),faiss运行在gpu(计算复杂,追求性能)2 高过滤比:标量作为过滤条件,有较高的过滤比(大于99%),过滤后候选集大(以外卖商品为例,符合LBS过滤的商品向量候选集仍然超过百万)。1 支持向量+标量混合检索:在向量检索的基础上,支持复杂的标量过滤条件。
2024-05-16 17:32:49
559
原创 推荐系统稳定性建设
通常推荐系统会分为召回->过滤->粗排->精排->重排->规则排序等。对于大型推荐系统,每个环节都是一个子系统,那么每个子系统的性能和稳定性都将影响到整个推荐系统的稳定性。另外,对于保证高可用,另一个角度是提升系统的吞吐量。对于golang 系统,一方面是架构设计层面要合理,另外也可以通过重点分析CPU 和 内存分配等来进行优化。如红框处消耗CPU比例很高,考虑做性能优化或者下沉到下游服务(考虑模块职责归属)。2,3,4,5 网上资料较多,这里略去不表,应该作为框架的基础能力。
2024-01-24 17:54:32
638
原创 实验平台设计
背景随着沪江业务的高速发展,越来越多的产品运营开始关注数据驱动的精细化运营方法,期望通过精细化运营在一片红海中持续获得确定的用户增长、订单转化与收益,而 A/B 测试就是一种有效的精细化运营手段。# 设计思路要认识实验平台,首先要了解实验两个要素:流量:流量即用户的访问,也是实验的样本来源。参数:或者称作实验变量,一个实验可能有多种策略或者模型需要在线上进行比较,这些策略或者模...
2018-08-14 10:49:03
3764
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅