
机器学习
主要是总结一些机器学习中的问题和自己的思考
梁先森-在技术的路上奔跑
希望能做一个为周围人带来温暖,为家人和爱人带来幸福,为社会做出贡献的人
展开
-
前向逐步线性回归算法
前言前一篇博客,我们使用了缩减法中的岭回归来改进线性回归算法。其好处是能够减少过拟合,增大模型方差减小偏差。此博客将使用另一种方法对线性回归算法进行改进,其主要目的是找出对结果影响最大的几个属性值。背景和岭回归一样,lasso是也是属于缩减法的一种。但是由于其计算比较复杂,繁琐,我们使用另外一个简单的算法进行替代,这个算法就是前向逐步算法,该算法可以达到和lasso算法几乎一样的结果。这里前向逐步算法主要使用了贪心算法的思想,即每进行一步都要减少误差,直到最后迭代结束。前向逐步算法原理分析该算法原创 2020-07-08 15:25:19 · 6415 阅读 · 0 评论 -
岭回归算法的原理和代码实战
学过吴恩达老师的机器学习入门课程都应该知道,在逻辑回归那一讲,吴老师提到了使用正则化来防止逻辑回归模型过拟合。而岭回归在这里的作用是一样的,同样也是防止模型过拟合。这两者的区别在于,同样在使用差平方作为所损失值后,前者使用梯度下降法进行参数优化,而后者使用最小二乘法计算参数。原创 2020-07-03 08:41:25 · 4104 阅读 · 0 评论 -
局部加权线性回归算法原理分析和代码实战
前面我们介绍了最基础的线性回归算法,也提到了它容易出现欠拟合的现象。那么,本文的局部加权线性回归将解决这个欠拟合问题。我觉得这个思路具有很好的迁移性,咱们一起好好看看。原创 2020-06-24 16:23:52 · 4150 阅读 · 2 评论 -
线性回归算法拟合数据原理分析以及源代码解析
前面的博客讲的都是分类问题,接下来的几篇博客,会着重于回归,倾向于对数据进行预测。大家是不是一听到预测就眼睛一闪,是不是可以用来预测股票涨跌、彩票号码什么的!我只能告诉你有人做出来的股票预测软件,而且正确率挺可观的。作为一个学习者,别着急,千里之行始于足下。踏踏实实的从原理到代码,一步一脚印。原创 2020-06-24 12:45:51 · 6611 阅读 · 4 评论 -
简单易懂的ROC曲线和AUC面积
咱们在前面的学习中,对于模型的好坏,我们使用最多的是用精准度来衡量。这对于数据样本类别个数相对均匀来讲,是很好的衡量方法。但是对于数据样本类别极度失衡的情况,比如正样本有1000个,负样本只有10个,使用模型精准度来作为衡量标准就不合适了。接下来,咱们介绍一种新的衡量模型好坏的方法--ROC曲线。原创 2020-06-20 20:16:38 · 3711 阅读 · 1 评论 -
基于单层决策树的adaBoost算法思想分析和源代码解析
上一篇SVM可是废了我好鼻子劲,这一篇咱们来点愉快的东西。我们一定听说过这句俗语:“三个臭皮匠,顶个诸葛亮!” 大致意思就是三个能力一般的人加起来,也能抵得上一个能力很强的人。通俗意思就是人多力量大。没错,今天咱们所说的这个算法,就是利用这三个臭皮匠,去替代这个诸葛亮。原创 2020-06-17 15:49:32 · 1888 阅读 · 0 评论 -
历经一个月,终于搞定了SVM(支持向量机)-附源代码解析
其实整体算下来,断断续续的也得有快两个月了(原谅博主比较笨)。中间也有好几次放弃,不想写这篇总结了,但是之前立下的誓言,要将学习到的每一个机器学习算法写成博客总结,一方面呢,检验自己是否真的明白了,另一方面,也希望自己的理解能够帮助到一些人。原创 2020-06-11 17:51:29 · 36102 阅读 · 135 评论 -
Logistic 回归分类算法原理分析和实战
前面咱们已经学习完了KNN、决策树、朴素贝叶斯算法,这些都是解决分类问题的。今天,咱们要讲的也是解决分类问题,叫做Logistic 回归分类算法。原创 2020-05-21 10:53:11 · 3485 阅读 · 1 评论 -
一个Python例子带你理解朴素贝叶斯算法原理
前面我们在我们学习过KNN和决策树后,我们提出了一个问题,就是我们希望算法能够给我们一个分类概率,并不希望直接告诉我们分类情况。朴素贝叶斯将为我们解决这个问题。原创 2020-05-19 12:13:16 · 1362 阅读 · 0 评论 -
机器学习算法-决策树原理分析和源代码详解
上一篇文章我们介绍了KNN邻近算法,分析了这个算法的一些优缺点。这一篇,针对KNN无法理解数据内容的缺点,我们来介绍决策树。原创 2020-05-17 12:10:01 · 1283 阅读 · 0 评论 -
K-近邻算法(KNN)原理分析和代码实战
K-近邻算法,全称为K-nearest neighbor,简称KNN。它是一个原理非常简单,但是计算复杂度比较高的一个分类算法,接下来,我们先从原理出发,再进行源代码的解析。原创 2020-05-15 11:45:25 · 1579 阅读 · 0 评论 -
PCA(主成分分析-principal components analysis)学习笔记以及源代码实战讲解
在看完吴恩达讲解的PCA(主成分分析)方法后,想着能够用代码的方式实践一下。紧接着就借阅了一下《机器学习实战》里面对PCA的流程的讲解和代码。现在对PCA的运算过程还是比较明白的,也希望这份学习笔记能够帮助刚开始学习PCA的同学们。原创 2020-05-04 09:02:41 · 1924 阅读 · 1 评论 -
二分K-mean均值算法原理讲解和代码实战
二分K-mean均值算法原理讲解和代码实战原创 2020-04-26 11:15:43 · 1673 阅读 · 3 评论 -
K-mean均值算法原理讲解和代码实战
最近在学习吴恩达机器学习课程,刚刚学完第一个无监督学习算法,搭配着机器学习实战里面的k-mean实战,成功的将理论和实际结合了起来。接下来,咱们简单的分析算法原理之后,着重讲解一下源代码。原创 2020-04-26 10:46:45 · 3651 阅读 · 1 评论 -
(转载)百度架构师带你快速入门numpy--最好的入门资料
Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包。使用飞桨构建神经网络模型时,通常会使用Numpy实现数据预处理和一些模型指标的计算,飞桨中的Tensor数据可以很方便的和ndarray数组进行相互转换。转载 2020-03-25 17:19:18 · 526 阅读 · 0 评论 -
python和numpy纯手写3层神经网络,干货满满
在上一篇百度架构师手写2层神经网络的基础上,我们对模型进行修改,实现了3层神经网络模型原创 2020-03-25 17:01:40 · 4705 阅读 · 4 评论 -
numpy中*乘和dot()乘在这种情况下居然相等
说明今天在实战手写神经网络的时候,遇到了两个numpy的数组相乘的 情况。发现* 和dot()点乘居然相同。当且仅当,数组1形状(x,1) 数组2形状(1,y)时,两者相等import numpy as npa = [[1],[2],[3]]a = np.array(a)print("a.shape:",a.shape)b=[[1,2,3]]b = np.array(b)prin...原创 2020-03-24 21:39:50 · 193 阅读 · 0 评论 -
还不是知道CV?这篇文章带你入门CV(计算机视觉)
本篇文章不讲解任何算法,只是针对CV的发展历程和当前应用算法进行简单介绍,希望不了解的或者想从事计算机视觉研究的小白们有个大概的认识原创 2020-03-19 10:56:43 · 4432 阅读 · 0 评论 -
秒懂-深度学习框架的中计算准确率accuracy()原理(基于paddlepaddle)
前言最近在实操号称人工智能中的’hello world‘–手写数字集识别。这里是使用的是paddlepaddle深度学习框架。其中我们在训练的时候,需要计算准确度。框架提供计算准确度的方法:fluid.layers.accuracy().它究竟是如何进行精确度的计算的?今天,我带大家一探究竟!文章目录前言accuracy方法介绍accuracy()部分源码解析总结概括accuracy方法介...原创 2020-03-15 13:50:25 · 8303 阅读 · 0 评论 -
使用facebook的fbprophet模型预测湖北新冠肺炎确诊人数(包含源码和具体分析过程)
同样是身为一名程序员,别人就能够在疫情期间做出贡献,而我就只能在家自我修炼了。就在昨天,一次偶然的机会学习了以下fbprophet时序预测模型,就决定使用这个框架来进行未来20天人数的预测。但是传染病模型通常比较复杂,此次使用此模型来预测,仅仅是用来练习,结果仅供参考。fbprophet模型简介这个模型(算法)是由facebook公司在2017年正式开源的,主要用于对时间序列进行预测。...原创 2020-03-04 18:46:32 · 3025 阅读 · 3 评论 -
谈谈自己对机器学习如何学习以及未来职业方向的理解(不断更新中)
背景:数据分析在读研究生,目前研一,对自己未来的学习方向和职业方向没有清晰的认知。疫情在家学习,突然顿悟,要给自己一个明确的学习方向和职业方向。以下是我通过查找多方面资料自己的一些简介。参考资料链接:如何看待「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法?学习链接:更新于 2020年3月3日首先明确倾向于研究员还是工程师如果倾向于研究员,在学习已有机器算法的基...原创 2020-03-03 11:45:18 · 1709 阅读 · 2 评论