由于训练样本一般情况下是越多越好,但是生产中的样本量积累较慢,所以考虑用时间跨度比较大的样本进行训练,一方面可以提升模型的泛化性,另一方面还可以提升oot样本的评估指标。
因为采用了时间跨度比较大的样本,很难保证特征稳定性,可以考虑对样本进行时间加权,在筛选特征的时候PSI的筛选阈值放宽泛一些,防止IV值比较高的特征被踢掉。
本文讨论了在处理时间序列数据时,如何通过时间加权方法提高特征稳定性,同时对PSI筛选策略进行调整,以适应较长的时间跨度问题,旨在提升技术应用的效率和准确性。
由于训练样本一般情况下是越多越好,但是生产中的样本量积累较慢,所以考虑用时间跨度比较大的样本进行训练,一方面可以提升模型的泛化性,另一方面还可以提升oot样本的评估指标。
因为采用了时间跨度比较大的样本,很难保证特征稳定性,可以考虑对样本进行时间加权,在筛选特征的时候PSI的筛选阈值放宽泛一些,防止IV值比较高的特征被踢掉。
3288
216

被折叠的 条评论
为什么被折叠?