
学习
文章平均质量分 59
小小数据挖掘工程师
即将毕业小硕一枚,记录自己编程学习生涯!可以交个朋友吗?一起撸代码鸭!
展开
-
可解释的机器学习库—SHAP
1.SHAP介绍SHAP(SHapley Additive exPlanations),是Python开发的一个“模型解释”包,它可以解释任何机器学习模型的输出。 所有的特征都被视为“贡献者”。 对于每个预测样本,模型都产生一个预测值,SHAP value就是该样本中每个特征所分配到的数值。 SHAP值从预测中把每一个特征的影响分解出来,可应用于如下场景中:模型认为银行不应该给某人放贷,但是法律上需要银行给出每一笔拒绝放贷的原因。 医务人员想要确定对不同的病人而言,分别是哪些因素导致他们有患某原创 2020-11-09 16:12:02 · 14772 阅读 · 4 评论 -
特征筛选之—IV值
一.定义IV(Infromation Value),信息价值,用来表示特征对目标预测的贡献程度,即特征的预测能力,一般来说,IV值越高,该特征的预测能力越强,信息贡献程度越高。二.限定条件IV值的计算有一定的限定条件:(1)面向的任务必须是有监督的任务;(2)预测目标必须是二分类的。三.IV取值区间及常用评价基准IV值的取值区间为:[0,正无穷)。IV值取值含义:(1)IV<0.02:无用特征(2)0.02<IV<0.1:弱价值特征(3)0.1&原创 2020-11-06 18:23:14 · 29531 阅读 · 0 评论 -
学习分享:推荐系统:基于协同过滤的思维导图分享
推荐系统结构图:协同过滤初步思维导图:总结: 用思维导图的方式记录学习知识,对梳理知识点非常有帮助!原创 2020-08-15 16:49:55 · 383 阅读 · 0 评论 -
第九周项目四:星星图案二
/**copyright (c) 2014, 烟台大学计算机学院.*All rights reserved.*文件名称:test.cpp *作者:陆云杰*完成日期:2014年10月23日 *版本号:v1.0* **问题描述:*程序输入:*程序输出:*/原创 2014-10-23 16:09:15 · 615 阅读 · 0 评论 -
第八周项目五:定期利息计算
/**copyright (c) 2014, 烟台大学计算机学院.*All rights reserved.*文件名称:test.cpp *作者:陆云杰*完成日期:2014年10月16日 *版本号:v1.0* **问题描述:用switch语句来解决多分段函数的求值*输入描述:一个整数x*程序输出:对应y的值*/原创 2014-10-16 20:09:58 · 1044 阅读 · 3 评论 -
手绘思维导图:第8,9章知识点总结
手绘思维导图:周一上课就画好的,手绘的一般般,总之画的时候要先有个总体的知识点的轮廓,才不至于画到最后空间不够。感觉这是一个很好的复习,总结的方式!原创 2015-04-25 11:08:31 · 1916 阅读 · 1 评论 -
数据挖掘经典算法之:K-means算法
一.K-means算法定义:K-Means 是一种基于距离的排他的聚类划分方法。上面的 K-Means 描述中包含了几个概念: 聚类(Clustering):K-Means 是一种聚类分析(Cluster Analysis)方法。聚类就是将数据对象分组成为多个类或者簇 (Cluster),使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。 划分(Part...原创 2018-08-04 15:02:16 · 1401 阅读 · 0 评论