- 博客(35)
- 收藏
- 关注

原创 计算广告系统学习路径记录
本文以互联网广告技术架构图为索引,展开记录本博客之后的更新路径,包括1)因果推断 (uplift建模)、2)广告反作弊、3)推荐算法(传统推荐算法、深度学习算法)、4)广告工程。同时还记录互联网广告的业务知识、上下游产业链等
2023-10-05 17:27:19
257
原创 反作弊中的无监督算法2_聚类的4种方式及典型算法
聚类的4种方式:1)基于原型的kmeans算法、2)基于密度的DBSCAN算法、3)基于概率模型的高斯混合模型、4)基于层次聚类的Louvain\GN算法
2023-11-27 20:39:23
1183
原创 逻辑回归(Logistic Regression)_推荐_前深度学习时代的常用算法1
逻辑回归算法的原理、Python实现、sckitlearn参数说明
2023-11-21 17:33:50
156
原创 TensorFlow基础1_对张量的基础操作_用Dataset API构建流水线
TensorFlow中对张量的定义;对张量的操作:拆分(split)、堆叠(stack)、连接张量(concatenate);构建数据流水线的方式
2023-11-19 15:12:31
103
原创 广告反作弊思路分享
目前络产的产业链较成熟,作弊逃不开的两大要素——账号和设备,其背后都有完整的资源和服务链条,见图1。同时,由于广告投放还存在归因的步骤,因此,还有一种作弊手段为,媒体获得大量设备id发给广告主,抢夺归因的作弊手段,同见表1。(注意,根据国家的法律要求,设备指纹在生成ID的过程中,不可以使用用户的个人隐私信息,如通讯录、手机号码、短信等)[2]。注1:设备的指纹不是成不变的,会随着时代的发展,不断更新——如机新增的压感应功能,就会多个参数;TCP、IP头信息,如TTL、起IP地址、端号;
2023-11-08 17:24:10
931
原创 因果推断、用户增长、广告系统 文章合集
本文持续收集一些与用户增长、广告投放相关的因果推断文章。(更新日期:2023-08-09)(更新日期:2021-07-08)
2023-10-01 17:25:00
150
原创 shell脚本学习笔记
shell是一个程序,用C语言编写,是用户和linux内核沟通的桥梁。它既是一种命令语言,又是一种解释性的编程语言。shell讲用户的指令翻译为二进制,传给内核处理。功能:将内容输出到默认显示设备echo命令的功能是在显示器上显示一段文字,起到一个提示的作用。功能说明:显示文字。语法echo [-ne][字符串]补充说明:echo会将输入的字符串送往标准输出。输出的字符串间以空白字符串隔开,并在最后加上换行号。-n 不要在最后自动换行。
2023-03-25 20:51:03
1112
原创 《计算广告》笔记2_基础知识准备
本文笔记来源于刘鹏、王超的《计算广告》第二版第十章,本文非常粗略的记录了计算广告涉及到的3个领域:信息检索(InformationRetrieval,IR),最优化(optimization),机器学习(MachineLearning,ML)
2023-03-21 10:01:36
228
原创 《计算广告》笔记1_计算广告技术概览
本文笔记来源于刘鹏、王超的《计算广告》第二版第九章关键技术概览;通过个性化系统框架展开讲述计算广告系统涉及的优化目标和技术
2023-03-21 09:55:00
459
原创 flink5_自定义函数
自定义函数(UDF)可以用 JVM 语言(例如 Java 或 Scala)或 Python 实现,实现者可以在 UDF 中使用任意第三方库,本文聚焦于使用 JVM 语言开发自定义函数。原文档:https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/functions/udfs/
2023-03-10 22:22:41
750
原创 flink4_flink SQL
source表、连续查询、Sink表Regular Joins、Interval Joins、Temporal Joins
2023-03-10 22:17:43
452
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人