利用强化学习优化债务催收的深度推荐系统
1. 引言
债务催收是从客户处收回欠款的过程,未偿还的债务会给金融领域带来巨大影响,减少未偿还债务能提高催收行业的收入。现场催收代理(FCA)需具备从消费者处收款的能力,最初催收员通过电话与客户沟通收款,但能响应电话的客户较少,之后催收员会上门催收。若客户逾期数月未还款,催收员可能难以处理,因此从一开始就密切监控和管理客户以防止逾期非常关键。
传统上,经理负责手动将客户分配给FCA,并指定收款和处理客户的指令,这一过程耗时费力。为解决这些问题,研究人员构建了基于强化学习(RL)算法的深度推荐系统来优化债务催收流程(DRS - DCP),该系统使用私营部门的金融数据,通过提供个性化推荐减少了FCA与客户映射的人力。
DRS - DCP系统通过以下四个目标优化债务催收过程:
1. 基于收款百分比以及访问强度、访问日期和时间、访问间隔等不同参数分析FCA的绩效,对FCA的绩效进行分类。
2. 使用深度强化学习(DRL)算法分析客户的信用风险和付款行为,预测客户风险类别。
3. 根据FCA绩效和客户风险类别,将客户分配给FCA,并推荐合适的日期、时间、话术和访问次数。
4. 设计债务催收过程的状态、动作、策略和奖励。
2. 强化学习术语
- 与监督学习的区别 :监督学习使用预先存在的数据集,而RL不使用,它通过随机探索环境并利用经验回放缓冲区存储经验来学习。监督和无监督算法没有探索和利用的过程,而RL试图平衡两者。RL进行顺序决策,而监督和无监督算法进行单一决策。RL的反馈基于奖励和惩罚,监督学习则以标记数据作为反馈。
超级会员免费看
订阅专栏 解锁全文
31

被折叠的 条评论
为什么被折叠?



