
机器学习
hfutdog
做技术的人要耐得住寂寞
展开
-
机器学习简介
机器学习101在这篇博文中,我们将从以下几个方面简要地向大家介绍一下机器学习。什么是机器学习?训练机器学习模型优化参数神经网络如果你不是这方面的专家,也不需要担心,因为在这篇博文中谈及的内容仅需要高中的数学知识就足够了。什么是机器学习?牛津词典将机器学习定义为:“The capacity of a computer to learn from experience”(计算机从经验中学习的能力)。机...翻译 2018-07-13 01:16:04 · 398 阅读 · 0 评论 -
常用激活函数
文章目录前言为什么需要激活函数什么样的函数可以做激活函数什么样的函数是好的激活函数前言今天这篇文章对一些常用激活函数做一下总结吧。在神经网络中激活函数还是很重要的,并且熟悉激活函数对理解别的问题也是很有帮助的。为什么需要激活函数从数学上看,神经网络是一个多层复合函数。引入激活函数是为了保证神经网络的非线性。因为线性函数无论怎样复合结果还是线性的,所以对激活函数最基本的要求是非线性的。假设...原创 2019-07-20 11:32:46 · 3023 阅读 · 1 评论 -
RNN与LSTM的区别
这篇文章简单总结一下RNN与LSTM的区别。首先,对于基本RNN来说,它能够处理一定的短期依赖,但无法处理长期依赖问题。比如句子The cat, which already ate …, was full.和句子The cats, which already ate …, were full.,两句话的差别在于主语和谓语动词的单复数,由于句子比较长,RNN就无法处理这种问题。那么RNN为什么无法...原创 2019-07-19 15:44:28 · 49895 阅读 · 8 评论 -
K近邻算法
K近邻算法基本原理距离度量k值选择分类决策规则总结参考文献基本原理k近邻(k-nearest neighbor, k-NN)算法是一种基本分类与回归方法。本篇文章只讨论分类问题中的k近邻算法。在k近邻算法中,假设给定一个训练数据集,其中的实例类别是确定的。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测这个新实例的类别。用一句谚语形容k近邻算法就是:“如果走像...原创 2019-07-07 00:26:15 · 1177 阅读 · 0 评论 -
交叉验证
交叉验证(cross validation)是一种常用的模型选择方法。 如果给定的样本数据充足,进行模型选择的一种简单方法是随机地将数据集切分成三部分,分别为训练集(training set)、验证集(validation set)和测试集(test)。训练集用来训练模型,验证集用于模型的选择,而测试集...原创 2019-07-06 17:59:01 · 336 阅读 · 0 评论 -
Python实现基本KMeans算法
文章目录前言基本KMeans两种改进算法前言聚类分析将数据划分成有意义或有用的簇。如果目标是划分成有意义的簇,则簇应当捕获数据的自然结构。聚类是一种无监督学习方法,因为只是根据样本的相似度或距离将其进行归类,而类或簇事先并不知道。常用的聚类算法包括:层次聚类、K均值聚类、DBSCAN。在这篇文章中我们简单介绍一下基本KMeans算法的实现。因为基本KMeans算法的原理比较简单,这里就不...原创 2019-07-14 01:00:43 · 2474 阅读 · 0 评论 -
机器学习中如何防止过拟合与欠拟合
文章目录过/欠拟合定义防止过拟合的措施防止欠拟合的措施参考文献过/欠拟合定义过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。防止过拟合的措施从数据入手,获得更多的训练数据。使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习到更多更有效的特...原创 2019-07-02 21:50:53 · 2316 阅读 · 0 评论 -
机器学习中常用范数与距离
机器学习中常用范数与距离前言范数向量范数矩阵范数距离曼哈顿距离欧氏距离切比雪夫距离闵可夫斯基距离标准化欧氏距离马氏距离余弦距离前言在机器学习中经常会涉及到范数和距离的概念,有时候优化的目标函数就是常用范数和距离的变化。关于范数和距离其实已经有很多人写过文章了,我之所以还要再写一遍,是因为读别人的文章我老是记不住,干脆好记性不如烂键盘,自己敲一遍吧。范数向量范数向量范数表示向量空间中向量的...原创 2019-06-22 19:06:36 · 1950 阅读 · 0 评论 -
sklearn计算准确率、精确率、召回率、F1 score
目录混淆矩阵准确率精确率召回率分类是机器学习中比较常见的任务,对于分类任务常见的评价指标有准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 score、ROC曲线(Receiver Operating Characteristic Curve)等。这篇文章将结合sklearn对准确率、精确率、召回率、F1 score进行讲解,ROC曲线可以参考我的这篇文章...原创 2019-03-06 16:27:26 · 179767 阅读 · 15 评论 -
sklearn ROC曲线使用
目录ROC曲线定义绘制ROC曲线AUC定义代码讲解二分类多分类这篇文章中我将使用sklearn的ROC曲线官方示例代码进行讲解,当然主要目的还是在于记录,好记性不如烂键盘嘛。ROC曲线定义ROC曲线是Receiver Operating Characteristic Curve的简称,中文名为“受试者工作特征曲线”。ROC曲线的横坐标为假阳性率(False Positive Rate,FP...原创 2019-03-03 09:10:13 · 30993 阅读 · 5 评论 -
Tensorflow实现逻辑回归(使用MNIST数据集)
今天我们讲一下如何使用Tensorflow实现逻辑回归,代码中采用了MNIST数据集。首先,我们去获取MNIST数据集(下载链接:http://yann.lecun.com/exdb/mnist/),并将其读取到程序中。代码实现如下所示:import tensorflow as tffrom tensorflow.examples.tutorials.mnist import inpu...原创 2018-09-02 16:34:16 · 5806 阅读 · 0 评论 -
Epoch、Batch Size和Iterations
我想在你身上一定发生过这样的情况吧:你感觉Epoch, Batch Size和Iteration这三个参数很相似却又分不清它们,只能坐在电脑前挠头想到:“为什么我要在代码里写这三种术语呢?他们究竟有什么不同?”为了找出这三个术语之间的不同,你需要通过学习像梯度下降这样的一些机器学习术语来帮助你理解。下面简单介绍一下梯度下降。梯度下降下图显示的是一个在机器学习中使用的通过迭代优化算法来找最佳结果(本...翻译 2018-07-15 15:06:06 · 2214 阅读 · 0 评论 -
卷积神经网络(CNN)学习笔记
文章目录前言计算机视觉边缘检测示例:更多边缘检测内容:Padding卷积步长卷积为何有效单层卷积网络简单卷积网络示例池化层卷积神经网络示例为什么使用卷积前言本篇文章是吴恩达《深度学习》课程《卷积神经网络——第一周》的学习笔记。计算机视觉计算机视觉面临的一个挑战是图像的数据量巨大。上述图片是计算机视觉领域的典型应用:图像分类、风格转换、目标检测。如上图所示,神经网络第一层参数矩阵巨大...原创 2019-07-21 06:27:02 · 1304 阅读 · 0 评论