
推荐系统
文章平均质量分 90
推荐系统与广告计算算法和模型
Just Jump
勿忘来时路上的脚印。站在巨人的肩膀上。
你没有比别人更努力,更不会比别人更不努力。你只是按照你能做到的、最适合你自己的办法去实现自己的目标,去成长为你眼中优秀的人们中的一员。
你自己、优秀的人群;决心、视野;自律、标准。
业精于勤,行成于思。
古之成大事者,不惟有超世之才,亦必有坚韧不拔之志。
苟有恒,何必三更起五更眠;最无益,只怕一日曝十日寒。 十五年只做一个行当。
展开
-
营销目标人群挖掘实践经验总结
上述展示的群体发现的过程是遵循数据挖掘的方法和框架的。主要流程和框架以下模型、分析方法是可以沉淀成标准化输入输出模版的:1、商品分析模型: 显著性分析、 相关性分析、odds比、Jaccard相关系数、 FP-Growth分析2、画像标签筛选模型: 分类模型特征筛选法、方差筛选法...3、人群分层模型: 排序模型、RFM分层模型、....在有些业务场景下,上述分析方法会失效。原创 2024-02-27 17:35:25 · 1365 阅读 · 0 评论 -
pyspark训练ALS模型注意事项
而用于隐式反馈时,每个评分代表的是用户会和给定产品发送交互的置信度(比如随着用户访问一个网页次数的增加,评分也会提高),预测出来的也是置信度。rank: 使用的特征向量的大小,更大的特征向量会产生更好的模型,但是也需要话费更大的计算代价,默认10。用于显式评分时,每个用户对于一个产品的评分需要是一个得分(例如1到5星),而预测出来的评分也是得分。MLlib/ ml中包含交替最小二乘法(ALS)的一个实现,这是一个协同过滤的常用算法,可以很好的。产品的页面但是没有对产品评分)交互皆可。原创 2023-08-15 19:08:29 · 530 阅读 · 0 评论 -
使用Spark ALS模型 + Faiss向量检索实现用户扩量实例
使用Spark ALS模型 + Faiss向量检索实现用户扩量实例原创 2023-08-10 16:39:22 · 1359 阅读 · 0 评论 -
Embedding在深度推荐系统中的3大应用方向
Embedding在深度推荐系统中的3大应用方向 - 知乎这里是 「王喆的机器学习笔记」的第十七篇文章,之前已经有多篇专栏文章介绍了从Word2Vec,到Graph Embedding,再到深度学习CTR模型等等Embedding相关的知识。作为深度学习推荐系统模型和CTR模型中不可或缺的“基…https://zhuanlan.zhihu.com/p/67218758在深度学习方向,Embedding、表征学习可谓是基石,是皇冠上的明珠了。这里是「王喆的机器学习笔记」的第十七篇文章,之前已经有多篇专栏文转载 2022-01-21 10:54:58 · 822 阅读 · 0 评论 -
7种经典推荐算法模型的应用
羊灵阿里云云栖号2022-01-04 19:007种经典推荐算法模型的应用本文调研了推荐系统里的经典推荐算法,结合论文及应用进行分析、归纳并总结成文,既是自己的思考过程,也可当做以后的翻阅手册。前言个性化推荐,是指通过分析、挖掘用户行为,发现用户的个性化需求与兴趣特点,将用户可能感兴趣的信息或商品推荐给用户。本文调研了推荐系统里的经典推荐算法,结合论文及应用进行分析、归纳并总结成文,既是自己的思考过程,也可当做以后的翻阅手册。俗话说学而时习之,人的认识过程是呈螺旋式上升的,特别是理...转载 2022-01-04 21:25:26 · 1239 阅读 · 0 评论 -
CTR/CVR预测模型的特征怎么找?不同类型特征怎么处理?序列Embedding特征怎么用?
浅谈微视推荐系统中的特征工程浅谈微视推荐系统中的特征工程浅谈不简单。https://mp.weixin.qq.com/s?__biz=MjM5ODYwMjI2MA==&mid=2649744942&idx=1&sn=7efd84c1371d785d719de481e3e6d44a&scene=21#wechat_redirecthannahguo腾讯技术工程2019-12-06 18:18本文作者:hannahguo,腾讯 PCG 推荐算法工程师在...转载 2021-12-30 16:31:06 · 3258 阅读 · 0 评论 -
序列特征Embedding后怎么用?
写在前面:前段时间做了个项目,用到了word2vec将用户浏览商品序列做了Embedding。但是这个Embedded的序列特征向量到底该怎么用呢?后面的模型该怎么设计呢?如何评价到底哪种用法是适合场景的?这种方法又该如何解释呢?所以,这里就解答这个问题。1、序列特征的处理方法之一:基于注意力机制方法序列特征的处理方法之一:基于注意力机制方法 - 知乎前言之前两篇讲过 稠密特征和多值类别特征加入CTR预估模型的常用处理方法,这篇介绍一下针对序列特征采用的最基本的注意力机制方法。我们都知道转载 2021-12-29 20:08:44 · 1159 阅读 · 0 评论 -
【转】数据挖掘,你不应该错过的六本书
2018-06-15|作者:张富峥、王英子不久前我们推出的《推荐算法不够精准?让知识图谱来解决》以及《如何将知识图谱特征学习应用到推荐系统?》系列文章受到了同学们的广泛欢迎。大家对推荐系统以及与之相关的、底层的数据挖掘技术非常关注。为了帮助小伙伴们更好地学习相关内容,我们邀请微软亚洲研究院社会计算组研究员张富峥和实习生王英子为大家推荐了六本数据挖掘领域的经典书籍,既涵盖了数据挖掘的概念、算法等基础知识,又包含了数据挖掘在不同子领域的具体应用。一起来看看吧!一、基础篇主要目标:帮助大家了解..转载 2021-12-29 12:07:24 · 4742 阅读 · 0 评论 -
word2vec应用的主要步骤及算法原理
写在前面:word2vec的算法实现参考博客:Spark MLlib — Word2Vechttps://blog.youkuaiyun.com/zhangchen2449/article/details/52795529?ops_request_misc=&request_id=&biz_id=102&utm_term=spark%20mllib%20word2vec%20霍夫曼树&utm_medium=distribute.pc_search_result.none-task原创 2021-11-18 20:29:48 · 2310 阅读 · 0 评论 -
[转]GBDT梯度提升决策树的理解
1、GBDT理论知识:GBDT的经典paper:《Greedy Function Approximation:A Gradient Boosting Machine》https://www.cnblogs.com/bentuwuying/p/6667267.html2、GBDT算法实践:模型流程、训练过程、特征选择、分类和回归、调参机器学习算法GBDT的面试要点总结-上篇https://www.cnblogs.com/ModifyRong/p/7744987.html3、论文http://.转载 2021-11-16 12:09:46 · 106 阅读 · 0 评论 -
【推荐书籍】《机器学习范式在推荐系统中的应用Machine Learning Paradigms- Applications in Recommender Systems》
前几天吐槽了一本口水太多的推荐系统书籍《Practical Recommender Systems实用推荐系统》,最近读到了这本《机器学习范式在推荐系统中的应用》(英文名《Machine Learning Paradigms- Applications in Recommender Systems》),只有一百三十来页,信息浓度挺高,参考论文丰富,适合有基础、想系统提升的同学们自学使用。正在读中.......原创 2020-08-11 23:30:40 · 294 阅读 · 0 评论 -
论文笔记《Item-based Collaborative Filtering Recommendation Algorithms》基于物品的协同过滤算法
这是一篇很经典的论文,2001年发表的。如果你已经很熟悉基于item的CF,那么这篇论文看起来就很舒适,很简单。读完这篇论文还是能收获很多实验设计上知识,实验严谨性和论证。值得一读。...原创 2020-08-11 17:08:08 · 1030 阅读 · 0 评论 -
论文笔记《Empirical analysis of predictive algorithms for collaborative filtering》协同过滤预测算法的实验分析
2013年的一篇论文。为使用IUF数据来提升模型效果提供了实验依据。看看实验设计也是蛮有意思的,很好的一套设计实验和评估的套路。原创 2020-08-07 18:54:46 · 350 阅读 · 0 评论 -
【转】推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干货分享
本文汇集了关于推荐系统原理、工程、各大长推荐架构、经验相关的纯干货。原理篇整理了内容推荐、协同推荐、举证分解、模型融合、Bandit和深度学习相关的经典方法。工程篇整理了推荐系统常见架构、关键模块和效果验证相关的资源。实战部分整理了Netfix、Hulu、Youtube、Google、Amazon、BAT、TMD等各大互联网公司推荐系统实战相关的经验。本资源整理自网络,原文地址:https://github.com/gaolinjie/awesome-recommender-systems...转载 2020-08-06 21:46:29 · 748 阅读 · 0 评论 -
【吐槽】《Practical Recommender Systems实用推荐系统》
在踩坑推荐系统的同学们,如果读过了项量的《推荐系统实践》,那么下面这本书《Practical Recommender Systems实用推荐系统》你就不要去读了。看过这么多本书,这是唯一一本让我忍不住吐槽“TMD啰嗦”的一本。寻找有用的知识点就像大海里涝针一样。知识浓度顶多一百页,竟然洋洋洒洒的写了400多页。我习惯并非常喜欢像数学一样简洁明了并富有技巧式的教科书,希望每一页都能收获惊喜。但这本书实在是全是作者的口水。太可怕了。想要总结出有点用的东西都不知道要过滤掉多少废话。(如果你没有推荐系统原创 2020-08-03 12:08:37 · 966 阅读 · 0 评论 -
【转】知识图谱上推荐推理的模仿学习框架
///又是一篇完全看不懂的文章,泪目了。唯叹一声,道路阻且长~~~原文标题:“SIGIR 2020 | 知识图谱上推荐推理的模仿学习框架”原文地址:https://www.msra.cn/zh-cn/news/features/sigir-adac原文作者:赵康智、王希廷、谢幸编者按:尽管知识图谱推理的发展前景广阔,但在收敛性和可解释性上仍存在一定的问题。微软亚洲研究院的研究员利用一个基于元启发式方法的示例路径抽取方法来以较低的标记代价提取示例路径集合,进而提出了一个对抗的 Actor-Cri转载 2020-07-31 10:43:08 · 569 阅读 · 0 评论 -
【转】极深因子分解机模型XDeepFM
原文标题:“KDD 2018 | 推荐系统特征构建新进展:极深因子分解机模型”原文链接:https://www.msra.cn/zh-cn/news/features/kdd-2018-xdeepfm原文作者:练建勋编者按:特征(features)的构建对推荐系统来说至关重要,直接关系到推荐系统的精准性。在传统的推荐系统中,高阶交叉特征通常由工程师手工提取,不仅人力成本高昂、维度空间极大,而且不可泛化。因此自动学习特征的交互是十分有必要的 ,但目前已有的相关工作学习的是隐式的交互特征,且特征交.转载 2020-07-31 10:36:58 · 660 阅读 · 0 评论 -
【转】个性化推荐系统,必须关注的五大研究热点
原文标题:“个性化推荐系统,必须关注的五大研究热点”原文链接:https://www.msra.cn/zh-cn/news/executivebylines/tech-bylines-personalized-recommendation-system“猜你喜欢”、“购买过此商品的用户还购买过……”对于离不开社交平台、电商、新闻阅读、生活服务的现代互联网用户来说,个性化推荐已经不是什么新鲜事儿。随着信息技术和互联网行业的发展,信息过载成了人们处理信息的挑战。对于用户而言,如何在以指数增长的资源中转载 2020-07-31 10:20:12 · 1243 阅读 · 0 评论 -
【转】可解释推荐系统:知其然,知其所以然
原文标题:“可解释推荐系统:知其然,知其所以然”原文地址:https://www.msra.cn/zh-cn/news/features/explainable-recommender-system-ii又是需要学习的地方近几年,人工智能的可解释性问题受到了来自政府、工业界和学术界的广泛关注。美国国防部先进研究项目局DARPA资助了可解释性人工智能项目XAI(Explainable AI);中国国务院在《新一代人工智能规划》中提出的“实现具备高可解释性、强泛化能力的人工智能”目标,得到了各个公司转载 2020-07-31 09:57:23 · 484 阅读 · 0 评论 -
【转】如何将知识图谱特征学习应用到推荐系统
原文标题:如何将知识图谱特征学习应用到推荐系统原文地址:https://www.msra.cn/zh-cn/news/features/embedding-knowledge-graph-in-recommendation-system-ii目前还完全看不懂,恰恰如此,才是学习的方向。将知识图谱作为辅助信息引入到推荐系统中可以有效地解决传统推荐系统存在的稀疏性和冷启动问题,近几年有很多研究人员在做相关的工作。目前,将知识图谱特征学习应用到推荐系统中主要通过三种方式——依次学习、联合学习、以及交替转载 2020-07-31 09:49:22 · 682 阅读 · 0 评论 -
【转】知识图谱在推荐系统中的应用价值
原文标题:推荐算法不够精准?让知识图谱来解决原文链接:https://www.msra.cn/zh-cn/news/features/embedding-knowledge-graph-in-recommendation-system-i推荐系统推荐问题从本质上说就是代替用户评估其从未看过、接触过和使用过的物品,包括书籍、电影、新闻、音乐、餐馆、旅游景点等。推荐系统作为一种信息过滤的重要手段,是当前解决信息超载问题的最有效的方法之一,是面向用户的互联网产品的核心技术。推荐系统的任务和难点转载 2020-07-31 09:23:09 · 1361 阅读 · 0 评论 -
【转】基于层次化注意力图网络和多视角学习的商品推荐
原文来自微软亚洲研究院的一篇文章,地址:https://www.msra.cn/zh-cn/news/features/emnlp-2019-rmg如果要做推荐和广告传播,Graph图论和深度学习是必须要掌握了。用户与商品的表示与交互个性化商品推荐中的一个关键问题是如何学习准确有效的用户和商品表示。一方面,我们希望从用户和商品的历史交互信息中对用户进行建模;另一方面,我们希望根据与商品交互的用户对商品进行建模。许多传统的个性化推荐方法基于矩阵分解技术,例如将用户和商品的评分矩阵分解后得到用户和商转载 2020-07-29 14:12:56 · 687 阅读 · 0 评论 -
【转】为什么搜索与推荐场景用AUC评价模型好坏?
【本文转自:https://mp.weixin.qq.com/s/uVZOfFayOzba5mALR5lHRQ】在互联网的排序业务中,比如搜索、推荐、广告等,AUC(Area under the Curve of ROC)是一个非常常见的评估指标。网上关于AUC的资料很多,知乎上也有不少精彩的讨论,本文尝试基于自身对AUC的理解做个综述,水平有限,欢迎指出错误。俗话说,提出正确的问题就成功了一半,本文先提出以下几个问题,希望大家读完能够加深对下列问题的理解。 AUC有几种理解? A.转载 2020-07-22 00:33:11 · 770 阅读 · 0 评论 -
【转】各大厂CTR 预估模型的进化之路【解释清晰】
原文来自云+社区,各大厂CTR 预估模型的进化之路导语笔者对各大厂商CTR预估模型的优缺点进行对比,并结合自身的使用和理解,梳理出一条CTR预估模型的发展脉络,希望帮助到有需要的同学。0.提纲1. 背景2. LR 海量高维离散特征 (广点通精排)3. GBDT 少量低维连续特征 (Yahoo &Bing)4. GBDT+LR(FaceBook)5. FM+DNN (百度凤巢)6. MLR (阿里妈妈)7. FTRL_Proximal (Google)...转载 2020-07-13 02:45:33 · 687 阅读 · 0 评论 -
【转】【较全的CTR模型概览】 推荐算法——CTR预估模型
知乎文章 : 推荐算法——CTR预估模型CTR预估模型可以广泛应用于个性化推荐、信息检索、在线广告等领域,用来学习和预测用户的反馈,用户的反馈主要有点击、收藏、购买等。数据CTR预估模型的特征数据往往包含多个特征,这些特征会根据其自身特点被编译成one-hot编码,然后将多个特征对应的编码向量链接在一起构成特征向量。高维、稀疏、以及多类别是输入给CTR预估模型的特征数据的典型特点。Embedding 表示又叫Distributed representation,相对于高维稀疏的.转载 2020-07-12 16:49:46 · 2415 阅读 · 0 评论 -
阿里DMR点击率预估模型解读
论文《Deep Match to Rank Model for Personalized Click-Through Rate Prediction》github开源地址:https://github.com/lvze92/DMRDeep Match to Rank ModelDMR的基本组成部分是特征表达层和多层感知机MLP。DMR架构图:从架构图上看,特征表达有多部分连接而成,Item-to-Item Network根据用户行为序列生成的,user-to-Item Networ.原创 2020-07-12 16:25:45 · 876 阅读 · 0 评论 -
【转】【美团技术团队】深入FFM原理与实践
原文链接:【美团技术团队】深入FFM原理与实践FM和FFM模型是最近几年提出的模型,凭借其在数据量比较大并且特征稀疏的情况下,仍然能够得到优秀的性能和效果的特性,屡次在各大公司举办的CTR预估比赛中获得不错的战绩。美团技术团队在搭建DSP的过程中,探索并使用了FM和FFM模型进行CTR和CVR预估,并且取得了不错的效果。本文旨在把我们对FM和FFM原理的探索和应用的经验介绍给有兴趣的读者。在计算广告领域,点击率CTR(click-through rate)和转化率CVR(conversion rat转载 2020-07-12 15:07:43 · 466 阅读 · 0 评论 -
【翻】Lucene相关性算法TF-IDF、BM25算法介绍
推荐参考文章:英文版:https://opensourceconnections.com/blog/2015/10/16/bm25-the-next-generation-of-lucene-relevation/中文版:BM25下一代Lucene相关性算法一、 TF*IDFTF*IDF :检索词和文档相关性的评分计算公式: tf * idfIDF * TF = log(numDocs / docFreq) * tf第一步,计算词频tf: 即检索词,如'dog'在文档中...翻译 2020-07-12 08:13:47 · 1290 阅读 · 0 评论 -
【转】推荐系统--完整的架构设计和算法概述
原文链接 ,知乎文章:推荐系统--完整的架构设计和算法(协同过滤、隐语义)2.推荐系统总体架构推荐系统架构,并不是互相独立的关系,实际的推荐系统可能会用到其中一种或者几种的架构。在实际设计的过程中,可以把其中一个架构作为设计的起点,更多地结合自身业务特点进行独立思 考,从而设计出适合自身业务的系统。根据响应用户行为的速度不同,推荐系统可以大致分为基于离线训练和在线训练的推荐系统。2.1 离线推荐离线训练的推荐系统架构是最常见的一种推荐系统架构。这里的“离线”训练指的是使用历史一段时间(.转载 2020-07-12 01:04:19 · 1436 阅读 · 0 评论 -
深度学习在搜索推荐上的应用survey
深度学习在搜索推荐上的应用参考文章阿里搜索团队智能内容生成实践 【阿里云开发者社区文章】 DNN在YouTube推荐上的应用【论文精读Deep Neural Network for YouTube Recommendation】 用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践(安利阿里淘宝搜素推荐事业部大牛清凇) DNN论文分享 - Item2vec 推荐系统遇上深度学习--阿里DMR:Matching和Ranking相结合的点击率预估模型..原创 2020-07-11 07:04:04 · 311 阅读 · 0 评论 -
【转】【重要】推荐系统之数据与特征工程
原文链接:推荐系统之数据与特征工程原文作者丨gongyouliu来自大数据与人工智能推荐系统是机器学习的一个子领域,并且是一个偏工程化、在工业界有极大商业价值的方向。大量应用于提供toC类产品的互联网企业服务中,通过推荐系统为用户提供精准的个性化服务。推荐系统通过推荐算法来为用户生成个性化推荐结果,而推荐算法依赖数据输入来构建算法模型。本篇文章我们来讲解推荐系统所依赖的数据,怎么处理这些数据,让数据转换成推荐算法可以直接使用的形式,最终我们就可以构建高效、精准的推荐模型,这些处...转载 2020-07-10 05:33:59 · 2705 阅读 · 0 评论 -
【转】基于知识图谱的推荐系统(KGRS)综述
以下文章来源于AI自然语言处理与知识图谱,作者Elesdspline作者信息Elesdspline目前从事NLP与知识图谱相关工作。导语本文是2020年针对知识图谱作为辅助信息用于推荐系统的一篇综述。知识图谱对于推荐系统不仅能够进行更精确的个性化推荐,而且对推荐也是具有可解释性的,有迹可循。本文汇总了近些年来知识图谱辅助推荐系统的一些研究工作,并按不同的方法进行划分类别(下图是我根据论文画出的大纲方法类别图);除此之外,汇总了不同场景下的知识图谱数据集,涵盖7个场景;最后阐述...转载 2020-07-09 08:35:35 · 7509 阅读 · 2 评论 -
【翻】TF-IDF、BM25模型用于相似性计算
在推荐算法中,计算相似性或距离度量是最常见的事情,也有非常多的相似性计算公式,比如基于集合的方法(谷本系数、J accard相似性系数),基于几何的方法(余弦相似性公式)等。这里介绍下来自信息检索领域的方法 TF-IDF、BM25模型用于计算相似性。参考文章 Distance Metrics for Fun and Profit假设我们有用户收听过音乐家音乐的数据,我们想要计算与某位音乐家相似的Top-N音乐家,用于音乐推荐或其他。一、TF-IDF模型用于计算相似性使用TF-ID..翻译 2020-07-08 06:49:39 · 952 阅读 · 0 评论 -
【翻】用矩阵因式分解MF的方法寻找相似音乐
原文Finding Similar Music using Matrix Factorization用户对Item的兴趣偏好数据有显式的、隐式的。显式的如评分数据,对电影的1-5星的评分,或者点赞、喜欢/不喜欢等明确表达了用户对物品喜好的数据。显式数据其实是比较稀疏的,更多的是隐式数据。比如用户观看过一个电影,但他并没有评分,我们不知道他看过后是喜欢还是不喜欢。或者用户浏览过一个商品、购买过一个商品,但并没有评价它,这些都是隐式的数据。本文介绍矩阵因式分解MF技术应用在这两种用户-物品数据上做推荐。.翻译 2020-07-08 04:52:26 · 376 阅读 · 0 评论 -
【翻】推荐系统Survey
参考文献:Recommender Systems Based on User Reviews: The State of the Art ,Li Chen·Guanliang Chen·Feng WangRecommender systems survey ,J. Bobadilla, F. Ortega, A. Hernando, A. GutiérrezHybrid Recommender Systems: Survey and Experiments ...翻译 2020-07-07 09:05:14 · 555 阅读 · 0 评论 -
矩阵分解MF用于评分预测
矩阵分解 Matrix Factorization矩阵分解简介矩阵分解,简单来说,就是把原来的大矩阵,近似分解成两个小矩阵的乘积,实际推荐计算时不再使用大矩阵,而是使用分解得到的两个小矩阵。假设用户物品评分矩阵为 R,维度为mxn,即 m 个用户, n 个物品。选择一个很小的数 k,k 比 m 和 n 都小很多,然后通过算法生成两个矩阵 P 和 Q,这两个矩阵的要求如下:P 的维度是 mxk,Q 的维度是 nxk, P 和 Q 的转置相乘结果为 R,即R=P*Q^T。也就是说分解得到的矩阵P和.转载 2020-07-02 04:45:59 · 1895 阅读 · 0 评论 -
项量《推荐系统实战》笔记
推荐系统知识框架梳理原创 2020-06-13 05:37:06 · 330 阅读 · 0 评论 -
计算广告知识框架
计算广告知识框架梳理注:导图中部分图片引用自一些文献或视频。原创 2020-06-13 05:35:49 · 233 阅读 · 0 评论