广告的目的与效果
广告:由确定的出资人通过各种媒介进行有关产品的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。广告的主体: 出资人、媒介、受众(三方的博弈)
- 品牌广告:创造独特良好的品牌或产品形象,目的在于提升较长时期内的离线转化率
- 效果广告:在短期内明确用户转化行为诉求的广告。
广告 vs 推荐系统:
- 广告:文字链 好于 图片
- 推荐系统:图片 好于 文字链
搜索、广告与推荐的比较:
. | 搜索 | 搜索广告 | 显示广告 | 推荐 |
---|---|---|---|---|
首要准则 | 相关性relevence | 投资回报率ROI | · | 用户兴趣 |
其他需求 | 各垂直领域独立定义 | 质量,安全性 | · | 多样性diversity,新鲜度freshness |
索引规模 | ~十亿级 | ~百万级–千万级 | ~百万级 | ~百万级–亿级 |
个性化 | 较少 | 较少 | 亿级用户 | 亿级用户 |
检索信号 | 集中 | 集中 | 丰富 | 丰富 |
Downstream优化 | 不适用(搜索结果是终点) | 不适用 | 不适用 | 适用。同质化(点一个商品推下一个,点一个新闻推下一个新闻) |
在线广告的独特性
- 技术和计算导向
- 可衡量性
- 标准化
在线广告的核心计算问题
maxa1,...x∑i=1TROI(ai,ui,ci)
m
a
x
a
1
,
.
.
.
x
∑
i
=
1
T
R
O
I
(
a
i
,
u
i
,
c
i
)
优化角度:
- 特征提取:受众定向
- 微观优化:CTR预测
- 宏观优化:竞价市场机制
- 受限优化:在线分配
- 强化学习:探索与利用
- 个性化重定向:推荐技术
系统角度:
- 候选查询:实时索引
- 特征存储:No-sql技术
- 离线学习:Hadoop
- 在线学习:流计算
- 交易市场:实时竞价
挑战:
- 大规模:百万量级页面、十亿量级的用户;高并发;Latency的严格要求。
- 动态性:用户的关注和购物兴趣非常快速地变化
- 丰富的查询信息:需要把用户和上下文中多样的信号一起用于检索广告候选
ROI:点击率(CTR) × 点击价值
eCPM=∑i=1Te(ai,ui,ci)=∑i=1Tμ(ai,ui,ci)v(ai,ui)
e
C
P
M
=
∑
i
=
1
T
e
(
a
i
,
u
i
,
c
i
)
=
∑
i
=
1
T
μ
(
a
i
,
u
i
,
c
i
)
v
(
a
i
,
u
i
)
在线广告系统
- 高并发投送系统:十毫秒级别的实时决策;百亿次每天的广告投放系统
- 受众定向平台:灵活的海量数据挖掘平台;前沿机器学习算法的分布式架构
- 数据高速公路:内部及外部TB级数据实时收集处理
- 流式计算平台:日志的准实时挖掘和反馈;反作弊与计价
相应的开源工具:
- Hadoop(HDFS、MapReduce)
- Hbase(Hadoop)、Cassandra(Facebook)
- mahout(Hadoop)
- Pig(Yahoo)、Hive(Facebook)
- Storm(Twitter)
- Thrift(Facebook)、Dubbo(Alibaba)、Avro(Hadoop)
- Zookeeper(Yahoo)
- Scribe(Facebook)、kafka(Linkedin)、flume(Cloudera)、Chukwa(Hadoop)
http://study.163.com/course/courseMain.htm?courseId=321007#/courseDetail