社区矫正措施推荐与高校信息管理服务研究
社区矫正措施推荐方法
在社区矫正领域,完整的推荐系统包含用户集和项目集,它们具有不同的属性。依据用户属性和偏好记录,能为不同用户推荐个性化偏好列表。经典且广泛应用的协同过滤算法存在无法解决冷启动问题和反映侧特征的局限。而社区矫正数据具有不平衡、稀疏和领域特征等特点,CTR预测方法能解决样本不平衡、数据稀疏、高维度和多领域特征交叉等问题,因此将推荐问题抽象为CTR预测。
对于CTR研究,常见的解决方案有逻辑回归(LR)、二次多项式映射(Ploy2)、因子分解机(FM)和场感知因子分解机(FFM)。与LR相比,FFM具有更好的非线性拟合性能;FM中每个特征只有一个隐藏向量来学习其他特征的潜在影响。所以,在社区矫正措施推荐问题上,采用基于FFM的方法。在优化器方面,FTRL优化器在产生稀疏性和性能表现上更有效,而基于随机(在线)梯度下降(SGD)的优化器稀疏性不足。结合FM + FTRL的研究表现优于FM + SGD,且收敛速度更快,因此引入FTRL优化算法来建立FFM算法,实现社区矫正对象所需矫正措施的推荐。
模型结构由数据处理层和算法层两部分组成:
1. 数据处理层 :
- 从社区矫正系统数据库收集矫正对象及其矫正计划的数据。原始数据存在缺失值、无效值等问题,需进行预处理以构建高质量数据集,定义了27个原始对象数据属性。
- 将矫正对象 - 措施数据集划分为五个特征字段,便于后续算法提取特征间的交叉信息和不同字段间的潜在信息。数据预处理和特征工程处理后的格式为: label field1 : feat1 : val1 field1 : feat2 : val2 ...
超级会员免费看
订阅专栏 解锁全文

895

被折叠的 条评论
为什么被折叠?



