
信用风险计量与管理
文章平均质量分 91
ljtyxl
大数据,智能算法研究,包括机器学习,深度学习,强化学习nlp等在推荐领域的应用和智能算法研究,比赛之类的合作联系qq:1329331182,wx:ljt1761
展开
-
Python金融大数据风控建模实战
Python金融大数据风控建模实战Python金融大数据风控建模实战https://blog.youkuaiyun.com/qq_40844276原创《Python金融大数据风控建模实战》 第18章 模型融合《Python金融大数据风控建模实战》 第18章 模型融合本章引言Python代码实现及注释本章引言模型融合思想认为,在多个表现较好的模型中,每个模型的预测结果都有一定的参考价值,并且每个模型在建模时考虑的策略也各有差异,如果能综合多个模型的优点,则最终的结果可能会更好。常用的方式为等权..转载 2021-05-26 10:23:08 · 3305 阅读 · 0 评论 -
Python 信用卡评分模型 自动分箱&逻辑回归&制作评分卡
import numpy as npimport pandas as pdfrom sklearn.cluster import KMeansfrom statsmodels.stats.outliers_influence import variance_inflation_factorimport statsmodels.api as smfrom sklearn.model_se...转载 2019-03-09 17:39:39 · 2285 阅读 · 0 评论 -
大规模图搜索和实时计算在阿里反作弊系统中的应用
经过多年在全球最大的电商平台大数据上的沉淀和积累,阿里电商反作弊形成了一套监控预警、识别分析和处罚管控的多维度监管机制,特别是对虚假交易的数据监控和算法识别上应用了覆盖全链路大数据的实时分析处理能力以及大规模图搜索技术来鉴别作弊行为。作者:涵空针对电商平台上的作弊行为,阿里巴巴一直秉承着零容忍的态度,在虚假交易的识别防控以及处罚力度上没有最强只有更强。经过多年在全球最大的电商平台大数据上的...转载 2019-03-13 23:04:51 · 386 阅读 · 0 评论 -
敏感词屏蔽
前言全文约1800字,阅读需3分钟。最近对直播比较感兴趣,被问到一个问题——如何屏蔽弹幕中的不良内容?于是便有了如下的学习内容。不止是弹幕噢~什么是敏感词汇?Q:哪些词算是敏感词汇?A:敏感词可大致分为以下几类:政治相关和人名、迷信邪教、黄赌毒、枪支弹药类、骂人讽刺类、时事类、广告和非法信息、其他。(网上有很多专门的敏感词库,我在网盘里上传了一份名为百度内部的敏感词文件,仅供查...转载 2019-03-13 23:01:49 · 6170 阅读 · 1 评论 -
作弊与反作弊
简介全文约3000字,阅读大约需要5分钟。你将看到以下内容:广告作弊与反作弊百度SEO反作弊淘宝电商反作弊互联网作弊是什么?互联网作弊是一种很普遍的行为,就我们所最熟悉的来说,有电商和O2O的刷单刷信誉行为、广告作弊等,具体分类如下图:广告作弊与反作弊1.背景:互联网广告成为主流2.数字营销(互联网广告)分两类:●品牌广告:以品牌宣传为主,多以千次曝光的...原创 2019-03-13 22:54:09 · 3487 阅读 · 0 评论 -
数据离散程度的衡量
我们通常使用均值、中位数、众数等统计量来反映数据的集中趋势,但这些统计量无法完全反应数据的特征,即使均值相等的数据集也存在无限种分布的可能,所以需要结合数据的离散程度。常用的可以反映数据离散程度的统计量如下:极差(Range) 极差也叫全距,指数据集中的最大值与最小值之差: 极差计算比较简单,能从一定程度上反映数据集的离散情况,但因为最大值和最小值都取的是极端,而没有考...转载 2019-03-01 23:26:42 · 4077 阅读 · 0 评论 -
汽车维保反欺诈系统的设计和算法应用
汽车维保反欺诈系统的设计和算法应用背景作为全球最大的汽车市场,中国在经历了多年的两位数增长以后,已经回落到个位数增长的“新常态”。随着汽车保有量的不断增加,以及汽车使用年限的增加,中国汽车售后市场(含配件、维保和增值服务)在整个汽车行业里的地位越发重要。汽车厂商、经销商和服务商等主体的关注点,也从新车销售逐渐转向汽车后市场。而随着行业竞争的加大,消费者理性消费意识增强,汽车后市场主体的利润...转载 2019-02-20 18:05:52 · 626 阅读 · 0 评论 -
基于理赔流程的车险反欺诈研究
基于理赔流程的车险反欺诈研究□陈辰 潘建亮 盛苗苗一、 国内外车险欺诈与反欺诈概述车险欺诈遍布全球,从上个世纪90年代开始,美国开始采取强硬措施以应对车险欺诈,并形成了以司法监督机构、保险公司、保险行业组织、车险理赔等相关机构为基础的在车险理赔风险管控有法可依,在反欺诈环节信息共享的保险反欺诈组织架构。相较于国外保险发达国家,国内车险反欺诈形式仍不容乐观。近年来,我国车险行业蓬勃发...转载 2019-02-20 17:57:04 · 2255 阅读 · 0 评论 -
基于逻辑回归的标准评分卡实现
基于逻辑回归的标准评分卡实现 由逻辑回归的基本原理,我们将客户违约的概率表示为p,则正常的概率为1-p。因此,可以得到: 此时,客户违约的概率p可表示为: 评分卡设定的分值刻度可以通过将分值表示为比率对数的线性表达式来定义,即可表示为下式: 其中,A和B是常数。式中的负号可以使得违约概率越低,得分越高。通常情况下,这是分值的理想变动方向,即高分值代表低风险,低分值代表高风险...翻译 2019-02-20 15:34:18 · 2330 阅读 · 0 评论 -
大数据风控的分与总
现在互联网贷款产品越来越多,模式也各有不一,用户人群也有所差异。而对于贷款来说,永远绕不开的话题就是风控。最近,一直在思考,对于不同的人群、不同的贷款产品,风控又有什么样的不一样呢?风控,风险控制,意图主要分为两类,一是排除坏人,二是挑出好人。那么如何定义坏人和好人以及如何判别,以下根据不同的场景,进行总结说明。1大数据风控现在大数据如火如荼,而风控领域也是大数据应用的一个很热门很有...转载 2019-02-28 09:43:31 · 1016 阅读 · 0 评论 -
企业大数据风控实践
接触风控时间很短(大概2个月),目前见解可能仍较浅,结合实际经验简单总结(依旧只讲方法不展开具体方案),不对或者不专业的地方欢迎指正。互联网风控都是基于大数据,属于数据应用层。企业中风控的核心价值在于识别、拦截作弊和降低作弊几率,尤其是和钱直接相关的欺诈行为;具体要做哪些和优先级还是要结合实际业务场景及问题。背景公司某业务部门已经发展了很多年,但数据能力整体较差,也没有风控;直到去年由...转载 2019-02-28 09:33:25 · 1239 阅读 · 0 评论 -
小额现金贷用户群体分析及风控体系搭建
我国拥有庞大的现金贷人群,这些人普遍未被传统金融机构覆盖,征信记录较为空白,风控是当前现金贷健康可持续发展的关键。那么,如何构建现金贷的风控体系?如何将风控贯穿在客户生命周期的每个环节?数据究竟在其中起到什么样的作用?现金贷的用户群体分析我国拥有四亿多现金贷业务的适配人群。这个适配人群,基于市场调研,是在18-45岁之间,未被传统金融机构覆...转载 2019-02-28 09:29:21 · 5239 阅读 · 0 评论 -
携程基于大数据分析的实时风控体系
携程反欺诈体系经过超过10年的发展和积累,在大数据实时并行计算和实时多维关联分析方面已经非常成熟,是整个体系稳定高效运行的基础。近两年来,我们在大数据和人工智能方向投入研发资源,产出了设备指纹、CDNA、实时复杂变量计算引擎等一系列创新项目,取得到很好的应用效果。2017年整体卡BP降低50%以上,远低于同行平均水平,为携程业务的发展以及全球化化进程提供了有利条件。一、性能和复杂度可以兼得...转载 2019-02-28 09:27:53 · 595 阅读 · 0 评论 -
信用风险评级模型的开发过程
参考《基于R语言的证券公司信用风险计量和管理》第三章一、信用风险评级模型的类型信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流融资模型和项目融资模型等。A卡,又称为申请者评级模型,主要应用于相关融资类业务中新用户的主...翻译 2019-02-18 10:44:25 · 7952 阅读 · 0 评论 -
数据挖掘中最易犯的10个错误,请绕行!
按照 Elder 博士的总结,这 10 大易犯错误包括:0、缺乏数据( Lack Data )1. 太关注训练( Focus on Training )2. 只依赖一项技术( Rely on One Technique )3. 提错了问题( Ask the Wrong Question )4. 只靠数据来说话( Listen (only) to the Data )5...转载 2019-02-18 10:26:52 · 168 阅读 · 0 评论