博主近期花了几个月时间,将搜索推荐行业一些经典的模型算法进行了整理,有的还加入了自己的浅显理解,还有一些是自己的经验文章,也都是搜索推荐行业,这个系列算是做完了,特来整理下每篇文章的链接和简要介绍
读懂、了解这些文章,基本上搜索推荐行业就可以算入门了,都是一些很经典的技术
一、经典模型算法系列
1:16年Youtube提出一篇dnn的模型方法,这也是用深度学习做搜索的一篇挺早的文章
YoutuBe 是如何利用深度学习解决搜索推荐问题的? (一) - 论文翻译
2:facebook在今年也提出来一个思路,协同过滤+深度学习来解决线上问题
facebook 将协同过滤加上深度学习来解决搜索推荐问题 (二) - 论文翻译
3:阿里巴巴也不甘落后,在之后发表了一篇当时线上带来稳定提升效果的用户兴趣匹配网络DIN
阿里巴巴线上使用的深度学习兴趣网络 DIN (三) - 论文翻译
4:接着就是比较经典的 点乘pnn 网络了
5:deepfm 一种专门用来分别处理稀疏特征和稠密特征的模型
6:继youtube那边论文后,谷歌又针对5中所描述的问题,提出来一种经典的模型
7:直到现在还有很多公司在线上使用的ftrl模型,因为其的易解释性
谷歌13年提出来的类似于lr的算法 - ftrl论文翻译(七)
二、博主在这个行业自己的一些技术总结文章,有讲特征工程的,有模型调参的,还有一些经典问题 比如bias
1:postion bias,一种没办法避免讨论的线下、线上问题
搜索、推荐业务中 - position bias的工业界、学术界 发展历程 - 系列1(共计2)
搜索、推荐业务中 - position bias的工业界、学术界 发展历程 - 系列2(共计2)
2:特征工程中,不可缺少的难点 - 实时系统搭建
3:离线特征工程设计 - 用4家互联网公司实际数据 来举例说明
4:有了特征工程,模型调参能少得了?
5:当要预估或者说是召回的item数量巨大时,必须要做候选集采样
神经网络 - 候选集采样 - Candidate Sampleing
6:DIN网络中的attention机制的来龙去脉
三、各大公司技术文章整理
快手:https://mp.weixin.qq.com/s/Wn-5VD2-YWwVUWCMEy-lvw
爱奇艺:https://mp.weixin.qq.com/s/R0GG6Kg-h50RTRU6DIrZCg
美图:https://mp.weixin.qq.com/s/b8DkQWZbUc5-jzWKBd8iUA
uc浏览器:https://mp.weixin.qq.com/s/FXlxT6qSridawZDIdGD1mw
阿里: https://mp.weixin.qq.com/s/_9Tl0cHkh9EhjHVES-ZT4A