- 博客(24)
- 收藏
- 关注
原创 定个小目标!生存分析(Survival Analysis)系列内容规划
导语:最近准备开一个关于生存分析的新系列,且主要是生存分析在信贷风控场景中的应用,之前在消费信用模型:定价、利润与组合这本书中稍微接触了一些概念,但自己功力太差,被搞得云山雾绕,一头雾水,最近追本溯源,读了一些文献,觉得似乎又看懂了,以我自己的经验,逼自己搞懂一个东西最好的方式就是完整地将整个框架/流程/发展脉络无障碍地书写出来,故有此规划~基础篇在基础部分将会介绍:生存分析的基本概念,能做什么,要解决什么问题,与传统的分类、回归模型的优势, 什么是删失数据等等,使读者对生存分析形成体感;介绍.
2021-07-11 23:03:11
844
3
原创 2021智能风控技术峰会内容摘要&补充-部分内容
导语:DataFunTalk在20210515线上举办的智能风控技术峰会上,金融风控,内容风控,安全风控,交易风控等各行业的大佬分享了他们的在模型设计,系统架构,落地应用等方面的实践,精力有限,本文简要整理本人比较感兴趣的内容细节,主要包含了图神经网络,时间序列模型,无监督算法等落地情况整体概览此次智能风控峰会分为9大细分论坛,4大场景,涉及系统架构/风控算法探索与实践,本人比较感兴趣的内容如图所示,因此本文大部分内容与这些分享主题有关,其他内容后续有机会在进行补充:优快云读者较少,如果此文其.
2021-06-29 07:37:41
471
原创 微信视频号推荐算法
导语:最近看了一眼微信视频号推荐算法的时间安排,初赛马上就要结束了,作为一个打工人,工作日自然要好好工作,划水是万万不能的,因此满打满算就只有剩下的2个周末可以动手实践了,现在数据集还没有下载,干看着赛题数据描述,简单构建一下思路,主业信贷风控模型,推荐算法是个彻底的小白,这次就纸上谈兵一下,后续再与TOP方案做深入对比,看自己思考得是否全面合理,本文以供查缺补漏,拟合大佬之用整体框架具体内容见知乎:https://zhuanlan.zhihu.com/p/380637348或者微信公众号:h.
2021-06-28 07:53:14
795
3
原创 图神经网络谱域方法:Spectral CNN,ChebyNet,GCN
导语:上文介绍了图拉普拉斯矩阵相关的知识点,本文开始学习图神经网络谱相关方法,去除了大量模型细节,补充了更多基本知识的推导过程,内容上更专注于写图卷积神经网络的演化过程,看研究者们是如何从卷积神经网络CNN的特性出发,在图这样不规则的数据上定义卷积神经网络,解决其中遇到的问题的过程,内容包括:最原始的谱卷积神经网络(Spectral CNN),到参数化卷积核的切比雪夫网络(ChebyNet), 最后到GCN网络的推导过程本文结构如下:文章目录符号定义图傅里叶变换拉普拉斯矩阵特征分解傅里叶基和傅里叶系.
2021-05-21 21:40:45
2055
原创 图拉普拉斯矩阵的定义、推导、性质、应用
导语:在学习图神经网络时,不可避免地要遇到拉普拉斯算子,拉普拉斯矩阵,图傅里叶变换,拉普拉斯特征分解向量等等一堆概念,了解其中的来源,定义,推导,对于后续图卷积神经网络的演进过程会有更深刻的理解文章目录基本概念偏导数拉普拉斯算子图拉普拉斯矩阵-来源推导-方法1:娓娓道来推导-方法2:直接干脆图拉普拉斯矩阵-性质两种表示形式二次型加权聚合总结公众号:一直学习一直爽,整理的GNN入门之路系列文章包含:GNN入门之路:01.图拉普拉斯矩阵的定义、推导、性质、应用GNN入门之路:02.谱域方法:Spe.
2021-05-06 07:44:19
8616
3
原创 3种场景下的相关性计算方式,热力图优化展示
导语:相关系数衡量的是两个变量同时变化的程度和方向,比如身高和体重,体重一般随着身高增加而增加,在很多情况下,我们处理的对象都是连续变量与连续变量之间的关系,但是还有离散变量与离散变量,连续变量与离散变量,因此本文将对这个话题进行总结,同时介绍一种新颖的相关系数矩阵可视化方法本文首发于个人公众号,私信骚扰文章目录case1: 连续变量与连续变量皮尔逊相关系数斯皮尔曼相关系数case2: 离散变量与离散变量Uncertainty coefficientcase3:连续变量与离散变量correlatio.
2021-04-04 18:00:44
2105
原创 LightGBM自定义损失函数的正确写法
导语: 在LightGBM中可以通过自定义损失函数和评价函数来解决新问题, 但在自定义损失函数时可能会忽略一些细节,导致效果不佳,收敛速度减慢。本文的背景是在GitHub的一个issues中读到了关于自定义的和官方提供的logloss不能完全复现的解决过程,当时没有太在意这个细节, 近期又读到作者关于当前开源的FocalLoss有相同的问题说法, 本文主要是拾人牙慧,在理解后的基础上,补充点笔记,跟着大佬再走一遍流程,以便加深记忆.本文首发于公众号、知乎专栏: 一直学习一直爽文章目录复现loglos.
2021-03-31 21:21:45
11026
3
原创 模型评估指标-2-ROC与PR曲线对比,TPR/FPR/Precision关系,3种特殊的评估指标
导语:在进阶篇里面,将会讨论ROC和PR曲线的联系,在不平衡数据中的偏差问题,同时利用公式来说明TPR/FPR/Precision三者之间的关系,在第三部分结合业务场景将介绍了几个特殊指标,但是没有说明如果根据指标去设计和优化模型,这个又要挖几个坑,等待后续来填了。文章目录ROC和PR曲线直观感受:在正负样本极度不平衡时,关注PR曲线,ROC可能掩盖模型的差异公式推导:TPR/FPR/Precision三者之间的关系模型评估要同时结合应用场景和模型指标Precision>=0.97的Recall.
2021-03-07 23:12:34
1775
原创 模型评估指标 -1- 基础篇 -FPR/TPR/F1/ROC/AUC
导语:本文是模型评估指标系列的第一篇,将详细地介绍分类模型中基于混淆矩阵衍生出来的各个指标的计算公式,如准确率,精确率,召回率,FPR,TPR,ROC曲线的绘制逻辑,AUC的计算公式等。本文首发在个人知乎和微信公众号:一直学习一直爽文章目录混淆矩阵-Confusion Matrix准确率-Accuracy精确率-Precision召回率-RecallF1-调和精确率与召回率真正率-TPR假正率-FPRKS灵敏度-Sensitivity特异度-Specificity从点到线-ROC曲线从点到线-PRC曲.
2021-02-28 10:56:33
4403
原创 MATLAB基本操作(九):可视化矩阵的矢量场quiver函数
矩阵的矢量化显示Last Edit 2014/3/5这里所说的矢量化显示是指为矩阵中的每一个点标注出该点的运动方向,或者其他矢量。如下图所示下同通过一个基本的例子来说明一个大致的过程。假设有一个矩阵A=[1 2 3 ;4 5 6],在每一个处沿水平方向的速度为u=[1 1 1;1 1 1],沿垂直方向的速度为v=[1 0 1;0 1 0];首先要做的就是确定
2014-03-05 14:20:23
16430
原创 MATLAB与图像处理(四):将图片序列转化为视频文件,将视频文件转化为图片
将图片序列转化为视频,将视频文件转化为图片Last Edit 2014/2/26一,将图片序列转化为视频文件function video=frames2Video(framesPath,videoName,quality,Compressed,fps,startFrame,endFrame)%framesPath :图像序列所在路径,同时要保证图像大小相同%videoN
2014-02-26 16:32:00
4942
原创 MATLAB基本操作(七):有关文件路径的几个函数在编程中的作用
有关文件路径的几个函数在编程中的作用Last Edit 2014/1/161,genpath: (gen=generate,顾名思义就是一个产生路径的函数,这个路径须存在)genpathgenpath directoryp = genpath('directory')>>genpath其结果为 C:\Program Files\MATLAB\R2009a\toolbox;C
2014-01-16 20:07:05
2896
原创 MATLAB基本操作(六):矩阵操作的相关函数
矩阵操作的相关函数Last Edit 2014/1/101,求行列式: det(A);2, 矩阵的逆:inv(A);3,矩阵的秩: rank(A);4,矩阵的范数:1-范数:norm(A,1); %实际上返回矩阵A列向元素和的最大值max(sum(abs(A))); 2-范数:norm(A,2); %返回矩阵A的最大的奇异
2014-01-10 21:35:44
1575
原创 MATLAB基本操作(五):MATLAB中的逻辑运算及all(),any()的使用
MATLAB中的逻辑运算及all(),any()的使用Last Edit 2014/1/9一,逻辑运算 这个没什么说的,学习高级语言的都明白。主要记录一下它的不同之处 1) &(与),|(或),~(非) 2) &&(与),||(或) MATLAB上述两种形式的不同之处在于,1)要计算出&,|两边的真假后才进行判断,而2)却跟我
2014-01-09 20:17:19
6669
原创 MATLAB基本操作(四):结构体struct&元胞数组cell
结构体struct&元胞数组cellLast Edit 2014/1/9一,结构体的使用 1)直接创建法: >> student.name='Tom';>> student.age=20;>> student.sex='male';>> studentstudent = name: 'Tom' age: 20 sex:
2014-01-09 19:55:47
35333
原创 MATLAB与图像处理(三):图像分成块
图像分成块Last Edit 2014/1/8首先是介绍imresize()函数的使用1)B=imresize(A,m); %将图像A的高和宽分别扩大m倍;2)B=imresize(A,[m,n]);%将图像的高和宽分别扩大m,n倍为什么要介绍这个呢?因为图像分块时可能出现小数个块,为了使用其能够最大程度的显示出图像来,先将图像变成其整数倍~~~clc; c
2014-01-08 22:15:13
16638
2
原创 MATLAB基本操作(三):数据类型
数据类型Last Edit 2014/1/8一,15种基本数据类型1)整型:int8,uint8 示例a=int8(100); int16,uint16 int32,uint32 int64,uint642) 浮点型: sign
2014-01-08 19:25:10
2251
原创 MATLAB基本操作(二):数组中操作
数组中操作Last Edit 2014/1/7主要记录几个常用的操作~一,创建数组的两个函数 1)linspace(a,b,n):表示创建从a到b的等差数组,个数为n 2) logspace(a,b,n): generates n points between decades10^a and 10^b二,size
2014-01-07 22:23:57
1936
原创 MATLAB基本操作(一):MATLAB中变量的文件存储
MATLAB中变量的文件存储Last Edit 2014/1/7MATLAB中与文件管理相关的几个命令what: 显示当前目录下与MATLAB相关的文件dir: 显示当前目录下所有的文件which: 显示指定文件的路径。 例: which test.mcd path: 转到相应的path路径下cd .. : 返回上
2014-01-07 21:24:13
2229
原创 MATLAB求欧式距离
MATLAB求欧式距离Last Edit 2013/12/23欧式距离公式有如下几种表示方法:举例说明:a=[0 0;1 0;0 2];pdist(a,'euclidean')ans = 1.0000 2.0000 2.2361结果是按照(1,2),(1,3),(2,3)来计算的,括号内的表示行号。
2013-12-23 09:03:42
11646
原创 MATLAB与图像处理(二):批处理读取多张图片,cell
批处理读取多张图片Last Edit 2013/12/11假如要从某一文件夹中读取66张图片,那么每次都使用I=imread('.....');这样处理速度不够快,不方便。下面就总结了几种批处理的方法。在讲解这几种方法之前,先介绍MATLAB中的一个cell,这个cell相当于一个数组,只不过它允许不同的元素是不同的类型的,比如:cell(1,3) 表示预分配
2013-12-11 10:16:15
9491
原创 MATLAB中的varargin,varargout在函数中运用
MATLAB中的varargin,varargout在函数中运用Last Edit 2013/12/10varargin,表示用在一个函数中,输入参数不确定的情况,这增强了程序的灵活性。 例如:function g=fun(f,varargin) 然后在程序中使用时,假如在调用函数时,intrans(f,a,b,c),那么:var
2013-12-10 11:21:15
6750
原创 MATLAB与图像处理(一):图像中结构张量的求法(Structure Tensor)
图像中结构张量的求法(Structure Tensor)Last Edit 2013/12/101.结构张量的作用: 能够区分图像中的平坦区域,边缘,角点;2.图像中的结构张量的定义 1)是一个矩阵; 2)与图像的水平,垂直梯度有关,定义如下:在MATLAB中,可以用如下语句求解:[Ix,Iy]=gradient(Image);3)
2013-12-10 10:46:47
8244
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人