受众定向技术分类
总体上看,按照计算框架的不同,这些受众定向技术可以分为3种类型:
- 用户标签,可以表示成t(u)形式的标签,以用户历史行为数据为依据,为用户打上的标签;
- 上下文标签,可以表示成t©形式的标签,根据用户当前的访问行为得到的即时标签;
- 定制化标签,可以表示成t(a, u)形式的标签,也是一种用户标签,不同之处在于是针对某一特定广告主而言的,必须根据广告主的某些属性或数据来加工。
以上各种定向中,地域定向、频道定向和上下文定向属于t©的定向方式;人口属性、行为定向属于t(u)的定向方式;重定向和新客推荐属于t(a,u)的定向方式。
上下文定向
从打标签的方法上看,上下文定向主要的几种思路如下:
- 用规则将页面归类到一些频道或主题分类;
- 提取页面中的关键词;
- 提取页面入链锚文本中的关键词;
- 提取页面流量来源中的搜索关键词;
- 用主题模型将页面内容映射到语义空间的一组主题上,这样做的目的是为了泛化广告主的需求,提高市场的流动性和竞价水平。
行为定向
行为定向:根据用户的历史行为进行挖掘的方法。具体可以描述为,根据用户一段时期内的各种网络行为,将该用户映射到某个定向标签上。
行为定向建模问题
行为定向问题的目标是找出在某个类型的广告上eCPM相对较高的人群。通常把某个用户在某类广告上的点击量作为建模的对象。
由于点击行为是离散达到的随机变量,对其数量最自然的概率描述是泊松分布:
其中,h为某个用户在某个定向类别广告上的点击量,t代表某个受众标签,而 λ t \lambda_t