KIR: Kwai Instant Recommend --端上智能在快手上下滑推荐取得APP时长+1%的应用实践

本文介绍了KIR(Kwai Instant Recommend)系统,它是快手为应对上下滑推荐场景而研发的端上智能解决方案。通过在智能手机终端进行DNN推理,KIR能实时修正用户偏好,提升了APP时长+1%。KIR系统包含实时排序、服务端与端上模型的协同以及多目标优化,显著改善了用户交互指标。

1.背景
1.1.端上智能

端上智能是相对于云计算人工智能应用(如推荐、搜索)的概念:如工业界成熟的推荐系统方案,几乎都是通过云计算的算力,在海量候选集中搜索用户感兴趣的Feed,并通过复杂的精排模型(百亿至千亿级参数规模)将排序Top的Feeds列表发送给智能手机终端。智能手机终端在这个过程中,只是对云端下发的Feeds列表进行渲染,收集用户反馈进行上报,并没有执行推荐算法。所有AI算法全都部署在云端,智能手机通过网络请求才能获得云端AI计算的结果。

近些年智能手机等终端设备的算力有了显著提升,这些算力足以支持一些中等规模的DNN模型进行推理与训练,一些原本只能在云端运行的AI模块,可以部署在智能手机终端上,从而使得智能手机终端,在不依赖云端的情况下,也可以进行独立的AI计算。

目前业内,手淘猜你喜欢在端上智能落地方面已有实践,并取得较为显著收益(EdgeRec[1, 2], 双十一ipv+10%, gmv+5%)。

1.2.上下滑推荐
上下滑推荐,相对于传统的Feeds流推荐,不再向用户展示Feeds封面列表,每一屏直接展示一个Feeds详情页内容,用户不能预知接下去展示的Feeds(见图一)。
在这里插入图片描述

图一: 封面瀑布流与上下滑
对于上下滑这种推荐形式,很自然的想到,每一屏消费一个视频时,用户都会产生显式/隐式的反馈,推荐系统根据这些实时反馈可以及时修正用户偏好,下一屏即向用户推荐更好的作品。

遗憾的是,上下滑的推荐形式并不支持手机终端每屏都请求云端重新生成一个推荐结果。客户端每次请求服务端,实际会下发PageSize(PageSize >> 1)个Feeds,等用户浏览完下发的PageSize个Feeds后,才会继续触发服务端推荐系统,重新计算并下发PageSize个Feeds(见图二)。

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值