
机器学习
文章平均质量分 92
路啦路
博客仅当作个人笔记使用
展开
-
使用图计算进行金融犯罪和欺诈检测:应用注意事项和展望
论文:Financial Crime & Fraud Detection Using GraphComputing: Application Considerations & Outlook摘要:文章概述了金融犯罪领域的最新技术发展趋势。讨论了图算法在金融犯罪和欺诈检测应用中存在的困难。2013年-2018 年,中国的移动支付增长超过 120%(复合年增长率)。另一一方面,在这种新的快速发展的数字支付格局下欺诈犯罪活动也迅速演变。全球金融犯罪量估计约为每年 1.4-3.5 万原创 2021-09-24 15:06:21 · 1024 阅读 · 0 评论 -
集成学习(一)—— 机器学习基础
1.导论什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用xix_ixi来表示一个样本,其中i=1,2,3,...,Ni=1,2,3,...,Ni=1,2,3,...,N,共N个样本,每个样本xi=(xi1,xi2,...,xip,yi)x_i=(x_{i1},x_{i2},...,x_{ip},y_i)xi=(xi1,xi2,...,xip,yi)共p+1个维度,前p个维转载 2021-03-15 22:29:45 · 496 阅读 · 0 评论 -
随机森林算法梳理
1.集成学习的概念1.1 个体与集成集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,又是也被成为多分类器系统(multi-calssifier system)。如下图显示出集成学习的一般结构:先产生一组“个体学习器(individual learner)”,再用某种策略将它们结合起来。1.2 同质集成和异质集成个体学习器通常由一个现有的学习算法从训练...原创 2019-08-07 20:43:47 · 798 阅读 · 0 评论 -
GBDT算法梳理
0、预备知识0.1回归树首先,GBDT使用的决策树是CART回归树,无论是处理回归问题还是二分类以及多分类,GBDT使用的决策树通通都是都是CART回归树。为什么不用CART分类树呢?因为GBDT每次迭代要拟合的是梯度值,是连续值所以要用回归树。对于回归树算法来说最重要的是寻找最佳的划分点,那么回归树中的可划分点包含了所有特征的所有可取的值。在分类树中最佳划分点的判别标准是熵或者基尼系数,都...原创 2019-08-11 14:27:54 · 270 阅读 · 0 评论 -
xgboost算法梳理
1、算法原理2、损失函数一般的机器学习的目标函数通常由两部分组成:训练样本的loss:也就是样本的预测值与真是标签之间的误差,本质上是为了十的模型输出尽可能你和真实标签;正则化项loss:一般来说有了上面这个训练样本的loss就够了,但是通常会发现,如果这个训练样本的loss足够小,这样的模型就比较复杂,也就是通常所说的过拟合。有了正则化项loss,这个loss主要从模型的学习参数上着...原创 2019-08-12 13:13:22 · 626 阅读 · 0 评论