
机器学习
又笨又懒的猪
这个作者很懒,什么都没留下…
展开
-
利用sklearn进行特征选择
3种特征选择Filter过滤法,按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征。(先对数据集进行特征选择,然后再训练学习器)Wrapper包装法,根据目标函数(通常是预测效果评分),每次选择若干特征,或者排除若干特征。(给定学习器选择最有利于其性能、“量身定做”的特征子集)Embedded嵌入法,先使用某些机器学习的算法和模型进行训练,得到各个特征的...原创 2019-12-20 22:27:47 · 6331 阅读 · 0 评论 -
集成学习ensemble learning
个体与集成集成学习通过构建并结合多个学习器来完成学习任务。如图,一般结构是:先产生一组“个体学习器”,再用某种策略将它们结合起来。如果集成中只包含同种类型的个体学习器,这样的集成是“同质”的。同质集成中的个体学习器称为“基学习器”,相应的学习算法称为“基学习算法”。类似地,异质集成中的个体学习器一般也称为“组件学习器”。要获得好的集成,个体学习器应该“好而不同”,即个体学习器要有一定的:准...原创 2019-12-19 22:51:58 · 229 阅读 · 0 评论 -
sklearn库实现三种贝叶斯分类器
sklearn官方教程https://scikit-learn.org/dev/modules/naive_bayes.htmlsklearn库朴素贝叶斯分类:https://blog.youkuaiyun.com/luanpeng825485697/article/details/78967139三种贝叶斯分类参数介绍https://www.cnblogs.com/JosonLee/p/10053...原创 2019-12-19 20:12:53 · 2866 阅读 · 0 评论 -
西瓜书——贝叶斯分类器+EM算法
西瓜书贝叶斯分类器详解:https://blog.youkuaiyun.com/yangjingjing9/article/details/79986371贝叶斯分类器应用—水果分类https://blog.youkuaiyun.com/qq_25948717/article/details/81744277贝叶斯分类器应用—影评态度分类https://blog.youkuaiyun.com/lsldd/article/deta...原创 2019-12-19 14:56:30 · 1412 阅读 · 0 评论 -
k-means、DBSCAN聚类算法代码
k-means聚类算法优点容易实现。缺点可能收敛到局部最小值,在大规模数据集上收敛较慢。适用数据类型数值型数据。伪代码创建k个点作为起始质心(经常是随机选择)当任意一个点的簇分配结果发生改变时 对数据集中的每个数据点 对每个质心 计算质心与数据点之间的距离 将数据点分配到距其最近的簇 对每一个簇,计算簇中所有点的均值并将均值作为质心k-means代码fro...原创 2019-12-16 22:10:00 · 1641 阅读 · 0 评论 -
聚类
聚类聚类是一种无监督学习,它试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”。聚类的性能度量聚类的性能度量又称为聚类“有效性指标”。聚类的期望结果是“簇内相似度”,且“簇间相似度”低。聚类性能度量分为两类:一类是将聚类结果与某个“参考模型”进行比较,称为“外部指标”;另一类是直接考察聚类结果而不利用任何参考模型,称为“内部指标”。外部指标基于上式,有聚类...原创 2019-12-16 14:13:28 · 1447 阅读 · 0 评论 -
机器学习三大算法——GBDT、XGBoost、LightGBM
本文主要简要的比较了常用的boosting算法的一些区别,从AdaBoost到LightGBM,包括AdaBoost,GBDT,XGBoost,LightGBM四个模型的简单介绍,一步一步从原理到优化对比。AdaBoost原理原始的AdaBoost算法是在算法开始的时候,为每一个样本赋上一个权重值,初始的时候,大家都是一样重要的。在每一步训练中得到的模型,会使得数据点的估计有对有错,我们就在每...转载 2019-10-28 17:20:29 · 1003 阅读 · 0 评论 -
XGBoost参数及代码实战
XGBoost参数解释:https://blog.youkuaiyun.com/qq_40587575/article/details/82886782XGBoost参数调优:Complete Guide to Parameter Tuning in XGBoost with codes in PythonXGBoost算法是一种高度复杂的算法,功能强大,足以处理各种数据不规则性。使用XGBoost建立...原创 2019-10-28 16:28:04 · 1838 阅读 · 0 评论