
大数据
呵呵镜
这个作者很懒,什么都没留下…
展开
-
学习笔记——吴恩达-机器学习课程-1.3 用神经网络进行监督学习
神经网络有时媒体炒作的很厉害,考虑到它们的使用效果,有些说法还是靠谱的,事实上到目前为止,几乎所有的神经网络创造的经济价值都基于其中一种机器学习,我们称之为“监督学习”,那是什么意思呢? 我们来看一些例子, 在监督学习中输入x,习得一个函数映射到输出y,比如我们之前看到的应用于房价预测的例子,输入房屋的一些特征,就能输出或者预测价格y。下面是一些其他的例子,这些例子中,神翻译 2017-10-30 14:16:28 · 1474 阅读 · 0 评论 -
感知器与梯度下降(一)
上一篇博客讲述了感知器分类的学习过程,想看文章详细请点击深度学习-感知器是怎么学习分类的?这是基于离散型的感知器来分析的,就是说感知器的输出结果是1或者0,表示分类的结果,蓝色的分类代表1,红色的分类代表0,输出的结果只有0和1两种,对于感知器的学习过程,wx+b>0 则输出1,否则输出0。今天我们来说一说梯度下降,如果将学习模型的误差函数比作是一座山,那么刚开始时候误差比较大,就好比...原创 2019-07-25 16:47:28 · 1270 阅读 · 0 评论 -
深度学习-感知器算法是怎么训练的?
最近在复习深度学习,最基础的感知器是神经网络的基础组成单元,理解一下感知器分类算法是如何进行数据训练的吧!从上面的图中可以看出,上面的数据集中的点,感知器会随机画一条直线作为分隔界限,从上面图中看出,初始的分隔界限产生了两个分类错误的点,那么怎么能进一步优化这个分隔线,使得他的分类效果达到更好?对于错误分类的点,感知器是努力让分割线离得更近一点,所以感知器会适当的调整分割线的位置,使得...原创 2019-07-19 16:53:14 · 1384 阅读 · 0 评论 -
机器学习网格搜索寻找最优参数
整理一下前阶段复习的关于网格搜索的知识:程序及数据 请到github 上 下载GridSearch练习网格搜索是将训练集训练的一堆模型中,选取超参数的所有值(或者代表性的几个值),将这些选取的参数及值全部列出一个表格,并分别将其进行模拟,选出最优模型。上面是数据集的可视化分布图,具体代码如下:%matplotlib inlineimport pandas as pdimpo...原创 2019-07-11 16:29:45 · 5979 阅读 · 0 评论 -
逻辑回归分类器的决策边界可视化
最近在复盘机器学习的内容,课程中最基础的例子是利用sklearn中的LogisticRegression 来进行将数据进行分类训练,并画出决策边界,这是课程中的效果图,下面来说一下我的程序:首先加载数据,练习中给的数据及有三列,x1,x2,y,x1和x2 是特征属性,y作为分类的结果,值有两种 0和1 ,所以这是二分类的问题import pandas as pdimport ...原创 2019-06-04 14:27:13 · 7244 阅读 · 2 评论 -
机器学习模型评估指标-混淆矩阵-精度-召回率-F1分数
最近在复盘udacity 的机器学习的课程,现在来整理一下关于机器学习模型的评估指标的相关知识。不同数据集采用不同的模型进行训练,会得到完全不同的效果,那么如何衡量一个模型是否适合该数据集呢?在数据集训练后可以对一些指标进行运算,观察实际的效果,进行调整参数或者更换模型等等。学习模型的评估指标常用的有几种:F-β得分(F1得分,F2得分等等,根据不同的业务实际需求来指定适合的β值),ROC...原创 2019-06-14 15:23:35 · 2191 阅读 · 0 评论 -
conda 常用命令
conda update -n base conda //update最新版本的condaconda create -n xxxx python=3.6 //创建python3.5的xxxx虚拟环境conda activate xxxx //开启xxxx环境conda deactivate //关闭环境con...原创 2019-04-11 11:45:50 · 288 阅读 · 0 评论 -
机器学习的学习曲线和验证曲线
最近在复盘优达学城的机器学习项目, 重新写了一下波斯顿放假预测的项目,除了模型的选择及网格搜索进行选择参数的相关知识外,还着重复习了关于学习曲线和复杂度曲线(验证曲线) 首先学习曲线和复杂度曲线(验证曲线)的区别,学习曲线是指在参数值确定的情况下,训练集和验证集的得分情况的对比,复杂度曲线(验证集曲线)是展示某个参数在取不同值时候,训练集与测试集得分情况的对比。...原创 2019-01-14 17:16:03 · 5893 阅读 · 1 评论 -
学习笔记——吴恩达-机器学习课程 1.2 什么是神经网络
1.2 什么是神经网络 “深度学习”指的是训练神经网络,有的时候 规模很大,那么神经网络是什么呢?我们从一个房价预测的例子开始,假设有一个六间房屋的数据集已知房屋的面积,单位是平房英尺或者平方米,已知房屋价格,想要找到一个函数,根据房屋面积,预测房价的函数,如果你懂线性回归,你可能会得到这样一条直线,但是,你可能也知道,价格永远不能为负,因此,直线不太合适,它最后会让价格为负数,翻译 2017-10-10 11:30:30 · 350 阅读 · 0 评论 -
感知器与梯度下降(二)
上一篇我们讲了感知器和梯度下降的关联,详细请查看 感知器与梯度下降(一)今天我们来讲一下,从算法上看,感知器和梯度下降的区别和联系。从上一篇中,我们得到了误差函数的表达式:误差函数是关于权重W的函数,画一个三维的图如下,误差函数是关于权重W1和W2的函数,在某一点上误差E的梯度是对w1和w2的偏导数的矢量和的反方向(相反数),如下图右侧所示:梯度下降的算法计算过程,我们来简单...原创 2019-07-31 11:42:57 · 727 阅读 · 0 评论