
李航统计学系方法系列
火星种萝卜
c++ vc mfc java
展开
-
卡尔曼滤波(kalman)相关理论以及与HMM、最小二乘法关系 转
卡尔曼滤波(kalman)相关理论以及与HMM、最小二乘法关系_weixin_30527143的博客-优快云博客转载 2022-02-14 14:42:34 · 290 阅读 · 0 评论 -
PageRank算法详解 - 知乎
PageRank算法详解 - 知乎转载 2022-01-19 12:36:11 · 934 阅读 · 0 评论 -
LightGBM和XGBoost使用scale_pos_weight处理不平衡数据源码分析
LightGBM和XGBoost使用scale_pos_weight处理不平衡数据源码分析 - 代码先锋网转载 2021-11-11 11:59:19 · 689 阅读 · 0 评论 -
GBDT、Xgboost、RF的区别
GBDT、Xgboost、RF的区别_请叫我小皇帝 的博客-优快云博客转载 2021-11-10 22:41:37 · 276 阅读 · 0 评论 -
出现module ‘xgboost‘ has no attribute ‘DMatrix‘的临时解决方法
出现module 'xgboost' has no attribute 'DMatrix'的临时解决方法问题根源:初学者或者说不太了解Python才会犯这种错误,其实只需要注意一点!不要使用任何模块名作为文件名,任何类型的文件都不可以!我的错误根源是在文件夹中使用xgboost.*的文件名,当import xgboost时会首先在当前文件中查找,才会出现这样的问题。 所以,再次强调:不要用任何的模块名作为文件名!https://blog.youkuaiyun.com/lt77701/java/...转载 2021-11-04 16:45:44 · 1288 阅读 · 0 评论 -
数据与特征对随机森林的影响(特征对比、特征降维、考虑性价比)
数据与特征对随机森林的影响(特征对比、特征降维、考虑性价比)_PanDawson的博客-优快云博客_随机森林降维转载 2021-11-03 11:02:19 · 234 阅读 · 0 评论 -
交叉熵损失(Cross Entropy Loss)计算过程
交叉熵损失(Cross Entropy Loss)计算过程_藏知阁-优快云博客_交叉熵计算公式转载 2021-10-21 14:54:11 · 981 阅读 · 0 评论 -
模型评估指标micro avg、macro avg和weighted avg的计算方式及区别
模型评估指标micro avg、macro avg和weighted avg的计算方式及区别-技术圈转载 2021-10-20 10:11:55 · 1380 阅读 · 0 评论 -
机器学习 二分类分类阈值_分类指标和阈值介绍
机器学习 二分类分类阈值_分类指标和阈值介绍_weixin_26752765的博客-优快云博客机器学习 二分类分类阈值_分类指标和阈值介绍_weixin_26752765的博客-优快云博客转载 2021-10-02 16:34:57 · 1036 阅读 · 0 评论 -
随机森林RF中的两个随机 抽样随机 特征选取随机 文章解释的好的
每棵树的按照如下规则生成: 1)如果训练集大小为N,对于每棵树而言,随机且有放回地从训练集中的抽取N个训练样本(这种采样方式称为bootstrap sample方法),作为该树的训练集; 从这里我们可以知道:每棵树的训练集都是不同的,而且里面包含重复的训练样本(理解这点很重要)。为什么要随机抽样训练集? 如果不进行随机抽样,每棵树的训练集都一样,那么最终训练出的树分类结果也是完全一样的,这样的话完全没有bagging的必要;为什么要有放回地抽样? 如果不是有放回的抽样,那么每转载 2021-09-20 16:04:57 · 848 阅读 · 0 评论 -
理解为何用期望最大化或梯度下降等启发式方法处理非凸函数在实际中如此有效,对于理论计算机科学而言是一大挑战
理解为何用期望最大化或梯度下降等启发式方法处理非凸函数在实际中如此有效,对于理论计算机科学而言是一大挑战一本关于理论计算机科学和机器学习之间关联的高水平、快节奏的集大成之作—《机器学习算法》计算机系统能力培养昨天【导读】近年来,有关机器学习的著作非常多,但是关于理论计算机科学和机器学习之间关联的书却不多见,今天要介绍的这本书《机器学习算法》,就是一本关于理论计算机科学和机器学习之间关联的高水平、快节奏的大作。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸..转载 2021-09-18 12:25:23 · 375 阅读 · 0 评论 -
GridSearchCV 调用模型的执行过程
GridSearchCV 调用模型的执行过程原创 2021-09-07 19:52:47 · 366 阅读 · 0 评论 -
随机森林采用多数表决的一种,最终表决结果不是树上的类别(class)频率,而是树上的各类别概率的平均值
在分类问题中,RF分类器根据多数投票(例如,投票结果)给出最终答复.是或否.另一方面,在Python中,我还可以看到带有事件最终概率的向量,例如0,83.如果我有1000个估计量,每棵树有1000个概率的平均值,那么该概率如何计算?clf = RandomForestClassifier(max_depth = 4, min_samples_split=2, n_estimators = 200, random_state = 1)clf.fit(train[columns], train["c转载 2021-08-25 16:20:57 · 338 阅读 · 0 评论 -
Grid SearchCV(网格搜索) 用法代码演示
注意没有参数n_iter=300否则报错 TypeError: __init__() got an unexpected keyword argument 'n_iter'https://www.cnblogs.com/wj-1314/p/10422159.html转载 2021-08-20 15:42:06 · 608 阅读 · 0 评论 -
百度 什么是主成分分析
https://baike.baidu.com/item/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90/829840?fromtitle=%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90%E6%B3%95&fromid=2652206&fr=aladdin转载 2021-08-20 14:44:37 · 141 阅读 · 0 评论 -
用正交变换化二次型为标准形的具体步骤
https://wenku.baidu.com/view/eb88c8e4bbd528ea81c758f5f61fb7360a4c2b72.html转载 2021-08-19 22:39:53 · 1694 阅读 · 0 评论 -
Some inputs do not have OOB scores. This probably means too few trees were used to compute any relia
Some inputs do not have OOB scores. This probably means too few trees were used to compute any reliable oob estimates. warn("Some inputs do not have OOB scores. "原创 2021-08-19 13:50:39 · 1271 阅读 · 0 评论 -
机器学习(四)——模型调参利器 gridSearchCV(网格搜索) scoring的
如果是None,则使用estimator的误差估计函数(3)scoring=None模型评价标准,默认None,这时需要使用score函数;或者如scoring='roc_auc',根据所选模型不同,评价准则不同。字符串(函数名),或是可调用对象,需要其函数签名形如:scorer(estimator, X, y);如果是None,则使用estimator的误差估计函数。具体值的选取看本篇第三节内容。https://blog.youkuaiyun.com/weixin_41988628/...转载 2021-08-19 12:20:29 · 1523 阅读 · 0 评论 -
min_sample_split 和min_sample_leaf区别
所以基本上,min_sample_split是分割所需的最小样本数。例如,如果min_sample_split = 6并且节点中有4个样本,则不会发生拆分(不管熵是多少)。在另一方面,min_sample_leaf基本上是叶节点所需的最小样本数。假设min_sample_leaf = 3并且一个含有5个样本的节点可以分别分裂成2个和3个大小的叶子节点,那么这个分裂就不会发生,因为最小的叶子大小为3https://www.cnpython.com/qa/291389...转载 2021-08-19 11:30:18 · 7095 阅读 · 0 评论 -
GridSearchCV 与 RandomizedSearchCV 用法注意随机搜索可以自定义打分 or loss 函数
在一些情况下,sklearn中没有现成的评价函数,sklearn是允许我们自己的定义的,但需要注意格式,接下来给个例子import numpy as npfrom sklearn.metrics import make_scorerdef logloss(act, pred): epsilon = 1e-15 pred = sp.maximum(epsilon, pred) pred = sp.minimum(1-epsilon, pred) ll = sum(a...转载 2021-08-19 10:45:34 · 403 阅读 · 0 评论 -
【机器学习】支持向量机 SVM(非常详细)
https://zhuanlan.zhihu.com/p/129008328转载 2021-08-19 10:36:40 · 116 阅读 · 0 评论 -
TSNE——目前最好的降维方法
https://blog.youkuaiyun.com/weixin_34279246/article/details/90102855转载 2021-08-18 18:10:06 · 439 阅读 · 0 评论 -
SVM、SVC、SVR三者的区别
https://zhuanlan.zhihu.com/p/37702043转载 2021-08-17 11:05:30 · 759 阅读 · 0 评论 -
使用class weight和sample weight处理不平衡问题
https://blog.youkuaiyun.com/xpy870663266/article/details/104600054/转载 2021-08-17 10:19:57 · 192 阅读 · 0 评论 -
Grid SearchCV(网格搜索)与RandomizedSearchCV (随机搜索) 贴近实践的
https://blog.youkuaiyun.com/xiaohutong1991/article/details/107946291转载 2021-08-17 10:14:21 · 290 阅读 · 0 评论 -
超参数搜索——网格搜索和随机搜索
https://cloud.tencent.com/developer/article/1187140转载 2021-08-17 09:30:51 · 104 阅读 · 0 评论 -
为什么要用随机搜索(Random Search) 知乎好文
https://zhuanlan.zhihu.com/p/26964683转载 2021-08-17 07:31:49 · 635 阅读 · 0 评论 -
API sklearn.neighbors.KNeighborsClassifier
https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html?highlight=kneighborsclassi#sklearn.neighbors.KNeighborsClassifier转载 2021-08-17 07:26:38 · 147 阅读 · 0 评论 -
网格搜索 随机搜索
https://www.bilibili.com/video/BV1S44y1r7qN?from=search&seid=3501694419494600913转载 2021-08-16 22:30:51 · 330 阅读 · 0 评论 -
超参数搜索——网格搜索和随机搜索
https://www.cnblogs.com/chenjx85/p/9430950.html转载 2021-08-16 22:19:32 · 272 阅读 · 0 评论 -
sklearn中随机森林的class_weight的作用?
https://www.zhihu.com/question/268906480/answer/343104406转载 2021-08-15 12:03:40 · 1959 阅读 · 0 评论 -
基尼不纯度示例代码
https://baike.baidu.com/item/%E5%9F%BA%E5%B0%BC%E4%B8%8D%E7%BA%AF%E5%BA%A6/22046808?fr=aladdin转载 2021-08-14 17:22:55 · 212 阅读 · 0 评论 -
洛伦兹曲线 基尼系数 和基尼不纯度 讲的非常好 非常清楚
https://zhuanlan.zhihu.com/p/76667156转载 2021-08-14 15:56:37 · 446 阅读 · 0 评论 -
特征工程 - 特征筛选
https://www.cnblogs.com/iupoint/p/11289650.html转载 2021-08-11 19:47:26 · 79 阅读 · 0 评论 -
机器学习中的模型选择和特征选择的基本方法
https://zhuanlan.zhihu.com/p/40195364转载 2021-08-11 19:40:47 · 291 阅读 · 0 评论 -
svm对未知数据的分类_基于SVM的高维不平衡数据分类方法与流程
https://blog.youkuaiyun.com/weixin_39833270/article/details/111519043转载 2021-08-11 18:29:22 · 381 阅读 · 0 评论 -
支持向量机原理详解(八): 多类分类SVM
https://zhuanlan.zhihu.com/p/66933242转载 2021-08-11 18:13:36 · 1641 阅读 · 0 评论 -
sklearn随机森林分类类RandomForestClassifier
https://blog.youkuaiyun.com/w952470866/article/details/78987265/转载 2021-08-11 10:19:15 · 496 阅读 · 0 评论 -
如何理解皮尔逊相关系数(Pearson Correlation Coefficient)
https://www.zhihu.com/question/19734616转载 2021-08-02 23:25:36 · 883 阅读 · 0 评论 -
先使用皮尔逊相似性特征选择来训练随机森林
https://blog.youkuaiyun.com/qq_36783389/article/details/107339312转载 2021-08-02 18:50:52 · 557 阅读 · 0 评论