从二值检索到层次竞买图——让搜索广告关键词召回焕然新生

目录:

   · 背景

   · 广告改写的历史与新目标

   · 从两阶段到一段式:二值海选

   · 从一段式到联合召回:层次竞买图

   · 关键词召回的业务思考

本文主要分享过去一年我们在搜索广告召回的传统领域--关键词召回方向上的一些实践。通过二值检索、层次竞买图两期的工作,先后完成了关键词召回从两阶段近似建模到一段式、从一段式到联合召回的两次算法架构升级,既在算力约束的情况下让召回阶段大批量广告在线打分成为可能,也让不同设计目标的Query改写算法不再"内卷",打开独立优化的空间,让直通车关键词召回焕然新生。

1 背景

随着移动互联网及信息技术不断创新,电子商务已经是数字化转型的基础设施,其中,商品搜索场景是客户寻找商品的必经环节,如何帮助客户定位所需商品成为了重要挑战,也是搜索广告商业化中帮助广告主精准投放广告要解决的重要问题。在阿里妈妈直通车搜索广告业务中,主要采用关键词拍卖与竞价排名的产品形式,因此,竞买词Bidword作为广告主圈选用户主动搜索流量的重要抓手,不仅起到计费作用同时也是重要的桥梁与计费作用。一直以来,关键词改写召回作为一种从用户搜索Query出发的召回方法,主要通过对Query的改写扩展与<Bidword,Ad>的买词倒排关系,形成相关广告召回与计价,它的优势在于:

  • 利用广告主自主圈选关键词流量的集体智慧,从Bidword维度分配流量,是搜索广告的启蒙形式;

  • 倒排索引是天然的动态索引,新广告买词append到对应倒排链末尾实时生效,能高效承载几十亿规模的广告索引与检索。

在关键词召回方向上,我们从改写关系<Query,Bidword>与倒排静态分<Bidword,Ad>两方面进行迭代,如图1.1所示,提高改写分与静态分两阶段近似海选分<Query,Ad>的准度,取得了业务效果与系统性能收益;但同时我们也意识到,目前的两阶段近似海选分,在面向效果的海选打分准确性与实时性、面向相关性与效果两个不同目标的改写通道融合quota分配问题上,仍是亟待解决的难题,且最终效果天花板受制于关键词召回目前先改写再打分的架构。

6b89d6181183275157d20fc701807b21.png
图1.1  直通车关键词召回海选分的演进

为了解决以上问题,关键词召回面临着3个挑战:

  • 算力强约束:在倒排检索内存与计算消耗约束下,用轻量高效检索模型替代改写分与静态分,提高海选打分的准确性与实时性。

  • quota-free全局排序:使关键词多目标改写不再需要设置quota,解耦改写分,实现各Bidword倒排链全局可比的排序。

  • 联合召回:进一步突破先召回Bidword再检索广告的模式,构建检索模型与索引结果联合学习、Bidword与Ad联合召回的高效高精度算法。

我们通过使用低存储与低计算的二值检索模型替换海选静态分,实现了海选从两阶段近似打分到一段式全局排序的跨越,在为低精度异质检索探索出有效方法的同时,大大优化了引擎负载与离线维护成本,打破了关键词召回的迭代天花板;又通过<Ad,Bidword>联合召回的层次竞买图,将DNN全库检索落地直通车召回场景,突破了关键词召回先改写再打分的架构,实现了检索模型与索引结构、改写与广告召回的联合学习。

2 广告改写的历史与新目标

在搜索广告场景较早期的阶段,竞价排名的产品形式决定了商家参与流量竞价的主动权在商家传统精确、宽泛的买词。广告改写的早期目标本质是提高召回率与高竞价队列填充(RPM最大覆盖),保障平台的竞价候选充足,因此广告改写算法作为关键词召回提效的关键,雅虎、百度等搜索引擎公司不断有改写相关研究出现;而随着推荐技术大踏步进入深度模型时代,算法的瓶颈不断被模型、算力克服,业界主要的研究也更集中在直接面向最终效果的query/user与ad的匹配排序问题上,广告改写因不是通用的推荐问题逐渐淡出了广告业界的主要研究方向。面对这个现状,将改写召回的目标对齐到最前沿的模型技术与面向最终效果学习的样本流,贯穿在我们的广告改写模型迭代中。

同时,随着各种商家推荐产品的发展,尤其是<Bidword,Ad>的传统人工买词关系也进入机器挖掘推荐词的阶段,我们意识到需要更积极的使用点击日志挖掘之外的语义目标,才能跳出“商家端推荐词、投放端改写计费”的数据自循环。为此我们在基于以RPM最大覆盖为目标、Query与人群共同隐式表达的深度双塔改写模型DeepNB基础上,强化语义抽取与关系生成,提出了面向语义关系的生成式改写模型GRM。但我们在生成式改写模型上线过程中发现,面向相关性的改写难以保证广告圈选集合的召回率与高竞价队列填充率,对大盘竞价(PPC)有负向影响,最终上线方案实际是与面向效果的DeepNB改写方法做通道融合竞争,而这个融合策略使改写不同通道间的改写分量纲不同,引入了难以优化的quota分配超参数。

因此,抛弃改写分、解耦召回quota分配,在海选阶段用一个统一的<Query,Ad>全库打分指标,在满足索引存储与检索效率下进行所有改写通道召回广告间的全局排序,解决高相关性与高竞价填充率的改写通道无损融合,将是打破现有关键词改写天花板的重要升级重构。经过过去一年在二值海选、

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值