数据挖掘
文章平均质量分 65
一天天的就知道学习
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘小白系列!LightGBM详解与调参
LightGBM调参指导针对leaf-wise树的参数优化:num_leaves:控制了叶节点的数目。它是控制树模型复杂度的主要参数。 如果是level-wise,则该参数为2depth2depth,其中depth为树的深度。但是当叶子数量相同时,leaf-wise的树要远远深过level-wise树,非常容易导致过拟合。因此应该让num_leaves小于2depth2depth。在leaf-wise树中,并不存在depth的概念。因为不存在一个从leaves到depth的合理映射。 ...原创 2020-07-09 22:38:11 · 5318 阅读 · 1 评论 -
数据挖掘小白系列!SVM与混淆矩阵
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=05a144c93bd1f66d0a25881a5fe5ce651数据挖掘流程=============================从实际应用来看,SVM在各种实际问题中都表现非常优秀。它在手写识别数字和人脸识别中原创 2020-06-20 03:25:42 · 2917 阅读 · 0 评论 -
数据挖掘小白系列!逻辑回归!
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=05a144c93bd1f66d0a25881a5fe5ce65逻辑回归网上说的太多了,就稍微说点偏实际应用的吧牛逼模型很多,为啥还要逻辑回归?线性回归对数据的要求很严格,比如标签必须满足正态分布,特征之间的多重共线性原创 2020-06-08 23:18:02 · 318 阅读 · 0 评论 -
数据挖掘小白系列!数据预处理及特征工程(下)-降维算法!
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=05a144c93bd1f66d0a25881a5fe5ce65数据挖掘小白系列!数据预处理及特征工程(上)!1概述=============================维度的概念不同的对象的维度概念不同:对原创 2020-06-05 02:33:42 · 639 阅读 · 0 评论 -
数据挖掘小白系列!数据预处理及特征工程(上)!
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=05a144c93bd1f66d0a25881a5fe5ce651数据挖掘流程=============================1. 获取数据2. 数据预处理数据预处理的目的:数据中检测,纠正不适用于模型的原创 2020-06-04 20:41:49 · 902 阅读 · 0 评论 -
数据挖掘自存代码~
数据挖掘系列自存代码原创 2020-06-03 16:41:35 · 346 阅读 · 0 评论 -
数据挖掘小白系列!机器学习中调参的基本思想
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=c0fdd78d4a7d79165f4406402caca6301大家都不说调参的原因=============================其一是因为,调参的方式总是根据数据的状况而定,所以没有办法一概而论;其二原创 2020-06-03 16:32:44 · 312 阅读 · 0 评论 -
数据挖掘小白系列!随机森林梳理及其参数详解!
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=c0fdd78d4a7d79165f4406402caca630使用流程 & 参数总表=============================9个主要参数:n_estimators,Criterion,两个随原创 2020-06-03 15:12:54 · 6737 阅读 · 0 评论 -
数据挖掘小白实战宝典系列!01决策树梳理及其参数详解!
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=05a144c93bd1f66d0a25881a5fe5ce65使用流程 & 参数总表=============================8个主要参数:Criterion,两个随机性相关的参数(rando原创 2020-06-01 21:07:25 · 619 阅读 · 0 评论 -
数据挖掘小白系列!XGBOOST参数超详解!参数选择,顺序,值一网打尽!
本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=05a144c93bd1f66d0a25881a5fe5ce651xgboost库使用流程 & 参数总表=============================参数调节顺序:0 根据情况决定booste原创 2020-05-22 04:59:36 · 15329 阅读 · 1 评论 -
数据挖掘小白的自存笔记-XGboost
XGBOOST全网通俗易懂的数据竞赛大杀器XGBoost 算法详解说明:真的是说的特别通俗易懂了SGboost和GBDT对比原创 2020-05-08 02:21:57 · 223 阅读 · 0 评论 -
数据挖掘小白的自存笔记-数据清洗该知道的都在这里
数据挖掘小白的自存笔记-数据清洗本笔记目的数据清洗很重要~看看不同于书本上查查网上各位大神的实操.成果思路篇:特征工程系列:数据清洗说明:该文章详细的说明了,数据清洗的方法和类型.建议实际过程中不时拿出来翻一番.数据清洗的一般流程: Step 1:格式内容清洗; Step 2:逻辑错误清洗; Step 3:异常数据清洗; Step 4:缺失数据清洗;(初...原创 2020-05-03 03:37:57 · 308 阅读 · 0 评论 -
数据挖掘小白的自存笔记 -图表应用场景
数据挖掘小白的自存笔记本笔记目的在做学习EDA的时候发现大神用各种各样的图,于是就很懵逼什么情况下该用什么样的图,花了4个小时浏览了几十个网页,去掉了重复和比较水的网页.保留下几个.成果链接1描述了5种数据关系,和图类型速览[对信息中包含的5种关系,可以简单归纳如下:]构成:占总体的百分比-表达的信息包括:“份额”、“百分比”以及“预计将达到百分之多少”,这时候可以用到饼图...原创 2020-05-02 23:23:01 · 246 阅读 · 0 评论
分享