
机器学习
weixin_42774642
这个作者很懒,什么都没留下…
展开
-
聚类--KM、DBACSN,层次聚类
1. 聚类对于聚类,关键一步是要告诉计算机怎样计算两个数据点的相似性,不同的算法需要的相似性是不一样的。1.1. DBSCAN1.1.1. DBSCAN原理 DBSCAN核心原理就是密度聚类的原理:寻找出稠密的地方,把它们当做一个簇,也就是密度相连的区域,我们把它当成一个簇。 “DBSCAN如何发现簇?”初始,给定数据集D中的所有对象都被为‘unv...原创 2020-03-06 16:35:09 · 1093 阅读 · 0 评论 -
理解L1,L2 范数
链接:https://www.zhihu.com/question/26485586/answer/616029832理解L1,L2 范数L1,L2 范数即 L1-norm 和 L2-norm,自然,有L1、L2便也有L0、L3等等。因为在机器学习领域,L1 和 L2 范数应用比较多,比如作为正则项在回归中的使用 Lasso Regression(L1) 和 Ridge Regressi...转载 2020-02-28 18:12:19 · 1228 阅读 · 0 评论 -
深度学习领域的神文(带注释版)
综合重磅!深度学习 500 问更新,GitHub 2.6W 星(附完整下载) - 红色石头的文章 - 知乎https://zhuanlan.zhihu.com/p/71979604神经网络与深度学习(github,国人总结整理的)https://nndl.github.io/这是作者多年以来学习总结的笔记,经整理之后开源于世。写得相当好:http://www.huaxiaozhuan.co...转载 2020-02-26 14:44:59 · 239 阅读 · 0 评论 -
机器学习-归一化、标准化的作用
目录(一)归一化的作用(二)归一化的方法(三)应用场景说明(四)参考文献:(一)归一化的作用在机器学习领域中,不同评价指标(即特征向量中的不同特征就是所述的不同评价指标)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级...转载 2020-02-26 12:28:23 · 654 阅读 · 0 评论 -
LightGBM原理及实现
LigthGBM是boosting集合模型中的新进成员,它和xgboost一样是对GBDT的高效实现,很多方面会比xgboost表现的更为优秀。原理上它和GBDT及xgboot类似,都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。LightGBM vs xGBoostxgBoost算法的优点:XGB利用了二阶梯度来对节点进行划分,相对其他GBM来说,精度更高。...转载 2020-01-16 17:30:41 · 1274 阅读 · 0 评论 -
LightGBM介绍及参数调优
1、LightGBM简介 LightGBM是一个梯度Boosting框架,使用基于决策树的学习算法。它可以说是分布式的,高效的,有以下优势: 1)更快的训练效率 2)低内存使用 3)更高的准确率 4)支持并行化学习 5)可以处理大规模数据 与常见的机器学习算法对比,速度是非常快的 2、XGboost的缺点 在讨论LightGBM时,不...转载 2020-01-16 17:13:45 · 836 阅读 · 0 评论 -
KMeans
概念:聚类分析(cluster analysis ):是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析也叫分类分析,或者数值分类。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或者相似度将其划分成若干个组,划分的原则是组内距离最小化而组间(外部)距离最大化。聚类和分类的不同在于:聚类所要求划分的类是未知的。聚类度量的方法:分距离和相似度来度量。...转载 2020-01-14 17:53:57 · 968 阅读 · 0 评论 -
如何使用TensorFlow Hub和代码示例
任何深度学习框架,为了获得成功,必须提供一系列最先进的模型,以及在流行和广泛接受的数据集上训练的权重,即与训练模型。 TensorFlow现在已经提出了一个更好的框架,称为TensorFlow Hub,它非常易于使用且组织良好。使用TensorFlow Hub,您可以通过几行代码导入大型和流行的模型,自信地执行广泛使用的传输学习活动。TensorFlow Hub非常...转载 2020-01-13 21:02:53 · 440 阅读 · 0 评论