- 博客(12)
- 收藏
- 关注
转载 基于python行为评分卡模型
什么是行为评分卡 基本定义:根据贷款人放贷后的表现,来预测其未来一段时间内发生逾期或违约风险概率的模型 使用场景:在放贷之后、到期之前,即贷中环节 使用目的:贷款人在贷款结束之前的逾期/违约风险下面是案例对本文有些概念不懂得可以看 信用评分卡模型的建立数据+代码下载关于数据 Loan_Amount:总的额度 OS:未还金融 Payment:还款金融 Spen...
2018-09-14 09:53:18
10771
3
转载 信用评分与数据挖掘
转载自:http://www.cnblogs.com/nxld/p/6364958.html1、数据挖掘思维导图思维导图为:Dr. Saed Sayad总结的An Introduction to Data Mining个人更喜欢的分类方式为:1、分类与预测2、关联3、聚类4、异常检测2、信用评分中的常见算法信用评分中主要包括申请评分、行为评分、催收评分卡、反欺诈。 其中,...
2018-09-07 14:16:47
3458
转载 Data-Mining试题
Data-Mining试题2011Alibaba数据分析师(实习)试题解析一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。Grubbs’ test(是以Frank E.Grubbs命名的),又叫maximumnormed residual...
2018-06-23 21:14:53
48186
转载 用R语言预测美国移动股票价格
说明:要考虑的因素为:美国的中国移动每日收盘价,美国标普500指数收盘价,港股中国移动收盘价, 数据日期从2000年10月19日到2016年10月13日。 在中间处理数据的时候,删除了部分因为美国市场和港股市场不同期开盘的数据。1、获取数据,找到相应的数据。R语言代码为:#获取数据getSymbols('CHL',from='2000-01-03',to...
2018-06-11 00:25:47
3891
1
转载 协整理论与面板数据分析
转载自:http://blog.sina.com.cn/s/blog_458bb22d0100x9rl.html面板数据分析方法步骤全解 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是...
2018-06-10 23:53:11
12063
转载 VAR模型分析联合内生变量的动态关系
VAR模型分析联合内生变量的动态关系一、实验介绍1.1 实验内容VAR模型是向量自回归模型的简称,是基于数据的统计性质建立的一种常用的计量经济模型,它把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。本实验运用 R 语言来建立两变量的向量自回归模型,首先是检验两变量序列的平稳性,然后进行协整检验,确定待拟合...
2018-06-10 22:24:31
14126
转载 R语言——关联规则
1.概念1.1 引论关联规则(AssociationRules)是无监督的机器学习方法,用于知识发现,而非预测。关联规则的学习器(learner)无需事先对训练数据进行打标签,因为无监督学习没有训练这个步骤。缺点是很难对关联规则学习器进行模型评估,一般都可以通过肉眼观测结果是否合理。 关联规则主要用来发现Pattern,最经典的应用是购物篮分析,当然其他类似于购物篮交易数据的案例也可以应用关联规则...
2018-05-24 16:24:24
3553
转载 EM算法详解
EM算法(Expectation Maximization Algorithm)详解主要内容 EM算法简介预备知识 极大似然估计Jensen不等式EM算法详解 问题描述EM算法推导EM算法流程EM算法优缺点以及应用1、EM算法简介 EM算法是一种迭代优化策略,由于它的计算方法中每一次迭代都分两步,其中一个为期望步(E步),另一个为极大步(M步),所以算法被称为EM算法(Expectation...
2018-05-14 15:19:20
12627
转载 Ridge回归、Lasso回归、坐标下降法、最小角回归
Ridge回归 可以看成是对最小二乘法的一种补充,岭回归通过对系数的大小施加惩罚来解决普通最小二乘法的一些问题。 它和一般线性回归的区别是在损失函数上增加了一个L2正则化的项,和一个调节线性回归项和正则化项权重的系数αα。损失函数表达式如下: J(θ)=12(Xθ−Y)T(Xθ−Y)+12α||θ||22J(θ)=12(Xθ−Y)T(Xθ−Y)+12α||θ||22 其中αα为常数系数,需要...
2018-05-10 12:52:11
2100
转载 lasso——两个包的用法
转自:http://blog.youkuaiyun.com/slade_sha/article/details/53164905先看一波过拟合:图中,红色的线存在明显的过拟合,绿色的线才是合理的拟合曲线,为了避免过拟合,我们可以引入正则化。下面可以利用正则化来解决曲线拟合过程中的过拟合发生,存在均方根误差也叫标准误差,即为√[∑di^2/n]=Re,n为测量次数;di为一组测量值与真值的偏差。实际考虑回归的过...
2018-05-10 12:48:52
5212
转载 贝叶斯算法 转载自 https://blog.youkuaiyun.com/u011826404/article/details/66525491
上篇主要介绍和讨论了支持向量机。从最初的分类函数,通过最大化分类间隔,max(1/||w||),min(1/2||w||^2),凸二次规划,朗格朗日函数,对偶问题,一直到最后的SMO算法求解,都为寻找一个最优解。接着引入核函数将低维空间映射到高维特征空间,解决了非线性可分的情形。最后介绍了软间隔支持向量机,解决了outlier挤歪超平面的问题。本篇将讨论一个经典的统计学习算法–贝叶斯分类器。7、贝...
2018-04-22 19:48:52
304
转载 Lasso思想及算法
最近在看一些优化算法,发现这个收集的资料不错,备份在这。是从这里复制来的。The Lasso Page 也有不错的资料。1、只有这么几个人在做LASSO,他们都是大牛,你可以直接GOOGLE他们的主页,看他们在这块发了什么文章。yu bin, zhu ji, zhang tong, hui zou, yuan ming, Nicolai Meinshausen,
2018-01-04 21:20:27
591
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人