市场篮分析、推荐引擎与序列分析及集成模型构建
1. 推荐算法比较
用户基算法在性能上略优于基于流行度的算法,不过二者都明显比随机推荐更有效。在实际业务中,选择哪种算法需由决策团队判断。
2. 序列数据分析
序列数据分析可用于挖掘纵向数据,了解观测状态随离散周期或事件的演变。例如,在分析客户购买产品的顺序、患者接受治疗或药物的顺序,甚至医生的开药习惯等方面都有应用。
TraMineR 包专为这类任务设计,可创建、计数和绘制随时间变化的各种状态转换组合,还能结合协变量。实际操作中,核心关注的特性包括:
- 转换率
- 每个状态的持续时间
- 序列频率
3. 序列分析的应用
为进行练习,可从 GitHub 下载一个人工数据集: https://github.com/datameister66/data/blob/master/sequential.csv 。该数据集包含 5000 条观测记录,每个观测记录包含客户历史和 9 个变量:
- Cust_segment :表示客户所属的细分市场
- Purchase1 到 Purchase8 :8 个离散的购买事件
每个购买变量包含产品的通用名称,共有 7 种可能的产品,从 Product_A 到 Product_G
超级会员免费看
订阅专栏 解锁全文
2647

被折叠的 条评论
为什么被折叠?



