- 博客(4)
- 收藏
- 关注
原创 机器学习模型保存pickle、joblib、pmml等三种方式的优缺点
机器学习模型保存pickle、joblib、pmml等三种方式的优缺点joblibsklearn中提供了高效的模型持久化模块joblib,将模型保存至硬盘。文件类型为二进制优点是效率很高(·透明的磁盘缓存功能和懒惰的重新评估(memoize模式)·简单的并行计算),读取速度也相对pickle快。from sklearn2pmml import PMMLPipeline, sklearn2pmmlfrom sklearn.externals import joblibimport pickle
2020-06-22 14:37:02
5500
原创 评分卡建模的流程以及细节剖析
评分卡建模的流程以及细节剖析created by hcy 20200620,记录一下自己对评分卡建模的细节梳理评分卡的优势以及缺点优点:可解释性很强、鲁棒性较好,适用于数据量较小的情况缺点:数据量大的情况下分箱速度很慢评分卡的建模流程1. 模型设计,target是如何定义的2. 剔除相关性强的变量,保留其中的一部分这里记录一下相关系数、协方差的概念协方差:在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。COV(X,Y) = E[(X-
2020-06-20 22:19:04
877
原创 解决jupyter启动kernel错误的方案
解决jupyter启动kernel错误的方案错误提示:KernelRestarter: restart failed解决方案折腾了我一上午,大功告成,希望能帮助有同样困惑的朋友错误提示:KernelRestarter: restart failed[W 11:21:52.854 NotebookApp] Kernel dfe5095a-6cdc-4bf1-93a6-3ab2f9b7cc91 ...
2019-08-27 11:48:18
22096
14
原创 Python Class中的私有方法
@学习笔记在看别人的源码时经常会遇到以__开头的属性或者方法,在此记录一下面向对象技术简介1,类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。2 .方法:类中定义的函数。3.类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。4.数据成员:类变量或者实例变量...
2019-06-25 14:43:44
3143
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人