
机器学习
机器学习
左小田^O^
这个作者很懒,什么都没留下…
展开
-
图解numpy数组矩阵
学习链接https://blog.youkuaiyun.com/qq_42189368/article/details/107403349原创 2021-06-16 16:07:44 · 139 阅读 · 0 评论 -
机器学习——动量与学习率衰减
动量动量法是梯度下降法的变式,在随机梯度下降的同时,增加动量。https://blog.youkuaiyun.com/weixin_40793406/article/details/84666803学习率衰减学习率 (learning rate)介绍学习率1https://blog.youkuaiyun.com/liulina603/article/details/80604385学习率 (learning rate),控制 模型的 学习进度 :lr 即 stride (步长) ,即反向传播算法中的 ηη :ω原创 2021-04-05 10:26:52 · 612 阅读 · 0 评论 -
机器学习——交叉验证(validation)和正则化(Regularization)
交叉验证其实就是讲数据集分成训练集和测试集,这是最简单的交叉验证。学习链接:https://www.zhihu.com/question/39259296https://blog.youkuaiyun.com/weixin_40475450/article/details/80578943正则化(Regularization)正则化是为了防止过拟合, 进而增强泛化能力https://www.zhihu.com/question/20924039https://www.cnblogs.com/jianxin原创 2021-04-05 10:03:56 · 306 阅读 · 0 评论 -
过拟合和欠拟合学习记录
https://zhuanlan.zhihu.com/p/72038532转载自https://blog.youkuaiyun.com/weixin_42575020/article/details/82949285https://blog.youkuaiyun.com/xuaho0907/article/details/88649141拟合(Fitting):就是说这个曲线能不能很好的描述某些样本,并且有比较好的泛化能力。过拟合(Overfitting):就是太过贴近于训练数据的特征了,在训练集上表现非常优秀,近乎完美的转载 2021-03-31 16:00:40 · 96 阅读 · 0 评论 -
机器学习——交叉熵
学习记录:学习链接-1学习链接2原创 2021-03-30 20:53:29 · 127 阅读 · 0 评论 -
AdaBoost算法学习总结
学习记录:1、scikit-learn Adaboost类库使用小结2、集成学习3、集成学习之Adaboost算法原理小结原创 2020-12-10 16:15:50 · 1045 阅读 · 0 评论 -
机器学习(十三):聚类(Clustering)hierarchical clustering层次聚类
假设有N个待聚类的样本,对于层次聚类来说,步骤:1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度;2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个);3、重新计算新生成的这个类与各个旧类之间的相似度。4、重复2和3直到所有样本点都归为一类,结束。整个聚类过程其实是建立了一棵树,在建立的过程中,可以通过在第二步上设置一个阈值,当最近的两个类的距离大于这个阈值,则认为迭代可以终止。另外关键的一步就是第三步,如何判断两个类之间的相似度有不少原创 2020-11-10 16:55:53 · 435 阅读 · 0 评论 -
机器学习(十二):聚类(Clustering)K-means算法
常用聚类算法总结1、 聚类(clustering) :属于非监督学习 (unsupervised learning)。无类别标记(class label)。2、举例:3、K-means 算法:K-means原理讲解3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一。3.2 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。3.3 算法思想:以空间中k个点为中心进行聚类,对原创 2020-11-09 21:29:49 · 363 阅读 · 0 评论 -
机器学习(十一):回归中的相关度和决定系数
相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:(1)、当相关系数为0时,X和Y两变量无关系。(2)、当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。(3)、当X的值增大(减小),Y值减小(增大),两个变量为负相关,相关系数在-1.00与0.00之间。相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。1、皮尔逊相关系数原创 2020-11-06 21:50:02 · 2897 阅读 · 0 评论 -
机器学习(十):非线性回归之逻辑回归(Logistic regression)
1、基本模型测试数据:测试数据为x(xo, x1,x2……xn),学习的参数:向量表示:处理二值数据,引入Sigmoid函数时曲线平滑化预测函数:2、cost函数解法:梯度下降(gradient decent)梯度下降的详细介绍...原创 2020-10-30 18:01:26 · 290 阅读 · 0 评论 -
机器学习(九):多元线性回归
1、与简单线性回归区别:多个自变量(x)2、多元回归模型3、多元回归方程4、估计多元回归方程5、估计流程6、估计方法7、举例一家快递公司送货统计10次:x1∶运输里程Miles,x2∶运输次数Deliveries,Y:总运输时间Time(Y) = bo+ b1Miles(x1) + b2 Deliveries(x2)数据代入后计算b0,b1,b2Time = -0.869 + 0.0611 Miles + 0.923 Deliveries预测如果一个运输任务是跑102英原创 2020-10-29 16:53:57 · 421 阅读 · 0 评论 -
机器学习(八):简单线性回归
1、统计量:描述数据特征2、集中趋势衡量2.1均值(mean):求和之后除以个数2.3中位数(median):将数据中的各个数值按照大小顺序排列,居于中间位置的数。2.3众数:数据中出现次数最多的数。3、离散程度衡量3.1方差(variance)3.2标准差(standard deviation)4、回归(regression)回归:Y变量是连续数值型(continuous numerical variable),如:房价,人数,降雨量。分类(classification):Y变量原创 2020-10-28 11:23:50 · 707 阅读 · 0 评论 -
机器学习(七):神经网络应用
超详细的应用讲解原创 2020-10-15 10:05:11 · 316 阅读 · 0 评论 -
机器学习(六):神经网络
1、什么是神经网络参考知乎上面的问答,很清楚讲解神经网络很清楚的讲解神经网络2原创 2020-10-14 11:35:30 · 282 阅读 · 0 评论 -
机器学习(五):支持向量机下
更详细的讲解SVM原创 2020-10-13 15:28:20 · 76 阅读 · 0 评论 -
机器学习总结(一):机器学习内容
机器学习介绍原创 2020-10-13 15:24:05 · 270 阅读 · 0 评论 -
机器学习(四):支持向量机(Support Vector Machine)上
基本思想:建立一个超平面,将两类样本进行分类,通过超平面最大化,将两类样本进行最优分类。H为使两类样本分开的的分类线。H1,H2为通过两类样本中离分类线最近样本点切与H线平行,称为决策线。H1,H2之间距离为分类间隔。分类间隔最大的分类线是最优分类线。假设一个超平面,不仅能将多维训练样本向量合理分开,同时还满足离超平面最近的向量与超平面之间距离最大,则超平面称为最优分类面,离最优分类面最近的向量称为支持向量。1、SVM寻找区分两类的超平面(hyper plane), 使边际(margin)最大.原创 2020-10-07 11:29:04 · 222 阅读 · 0 评论 -
机器学习总结(三):最近邻规则KNN算法(K-Nearest Neighbor)
1、综述是一种分类算法,输入基于实例的学习,是要输入已知的实例进行训练学习。又称懒惰学习。2、举例如下图,进行电影题材分类,前面题材都是已知的对最后一个电影是什么题材进行预测。如下图,将电影名称不同的点,打斗次数看成X轴,接吻次数看成Y轴,将结果看成点类型可以看成豆子分类,以实例为参照,根据位置实例到已知实例的距离进行判断。3、算法详述3.1步骤:为判断未知实例的类别,以所有已知类别的实例为参照,选择参数K,(K是选取周围实例的范围)。1.计算未知实例与所有已知实例的距离。2.选择原创 2020-10-05 11:46:03 · 371 阅读 · 0 评论 -
机器学习总结(二):决策树
1、基本概念基本概念︰训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归1.1训练集(training set/data)/训练样例(training examples):用来进行训练,也就是产生模型或者算法的数据集。1.2测试集(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法的数据集。一个运来训练,一个用来学习二者不冲突。1.3特征向量(features/feature vector) :属性的集合原创 2020-09-22 19:42:54 · 916 阅读 · 0 评论