1、ID-Mapping生成的基础之上
方式1、ID-Mapping数据表格式,可以利用企业主数据,或以其他方式生成
oneid phone idcard name ssoid uid beanid openid deviceid
1 138* 130826* 张三 U12* 123 123456 P1234 [vpe12sds1,vpe12sds2]
2 139* 110123* 李四 U22* 124 12q456 Po234 [vpe23sds3,vpe23sds4]
3 188* 610123* 王五 U22* 134 121456 Pop34 [deviceid1,deviceid2]
方式2、利用缓慢变化维
oneid phone idcard name ssoid uid beanid openid deviceid start_date end_date
1 138* 130826* 张三 U12* 123 123456 P1234 vpe12sds1 2021-01-01 2021-03-04
1 138* 130826* 张三 U12* 123 123456 P1234 vpe12sds2 2021-03-05 9999-12-31
2 139* 110123* 李四 U22* 124 12q456 Po234 vpe23sds3 2022-01-02 2022-02-08
2 139* 110123* 李四 U22* 124 12q456 Po234 vpe23sds4 2022-02-09 9999-12-31
3 188* 610123* 王五 U22* 134 121456 Pop34 deviceid1 2022-02-05 9999-12-31
3 188* 610123* 王五 U22* 134 121456 Pop34 deviceid2 2022-01-05 2022-02-05
以上内容oneid不为空,其他字段均有可能是空值
2、由于各系统主键不一致,可以按需或安场景进行不同的标签设计
例如:
用户属性标签表:u_tag_attribute_d ,主要包括用户年龄、性别、设备型号、注册状态、职业等静态特征属性 ;来源用户主数据表 主数据表主键是phone+idcard
用户行为标签表:u_tag_action_d ,主要包括消费行为、购买行为、访问、下单、收藏、购买、售后行为等; 主要来自销售记录表、售后记录表等,主键是phone+ssoid
偏好细分标签表:u_tag_prenference_d ,用户对于商品品类、商品价格阶段、各种营销渠道、购买类型偏好、不同营销方式的特征偏好;主要来自营销记录表,主键phone+idcard
用户分层标签表:u_tag_arrangement_d,用于对用户安生命周期,RFM(最近一次消费 (Recency)
、消费频率 (Frequency)、消费金额 (Monetary))、消费水平等进行分层划分;主要来自销售记录表,主键phone+idcard
风险控制标签表:t_tag_riskmanage_d,主要从用户征信、平台消费过程中产生的维度进行风险控制,主要来之金融、银行征信系统或消费行为表,主键idcard/deviceid
地理位置细分表:t_tag_position_d,主要标识用户常驻城市、居住商圈、工作商圈等信息,应用在基于用户地理位置进行推荐的场景中;主要是主数据、消费行为等,主键idcard
营销场景标签表:t_tag_sale_d ,主要以场景化进行分类,根据业务需要构建一系列的营销场景,激发用户的潜在需求,如差异化客服、场景用户、在营销用户等;
根据不同场景不通类型的标签表,其数据源对应的系统可能存在主键不相同的情况,那么就需要根据各个系统的差异性,进行差异性划分,最终目的是将不同标签表通过idmapping融合为一张或者多张能够提供服务的用户画像标签表;同时会存在一些数据采集问题,比如某个系统只能采集到设备号,但是由于设备号是变化的,那么此系统可以通过设备号作为主键融合到id-mapping中;
3、标签融合
select *
from id_mapping a
left join u_tag_attribute_d b
on a.phone=b.phone and a.idcard=b.idcard
left join u_tag_action_d c
on a.phone=b.phone and a.ssoid=b.ssoid
left join **** d
on a.deviceid=d.deviceid
and a.end_date='9999-12-31'
;
由于不同公司的数据质量差异不同,均需要修正数据质量