
machine learning
文章平均质量分 53
limn2o4
这个作者很懒,什么都没留下…
展开
-
Reinforcement Learning: An Introduction 阅读笔记(一)
前言开新坑系列……先来谈谈什么是强化学习,或者说增强学习。强化学习就是指再一个特定环境下,通过与环境交互,获得环境的反馈从而进行学习的智能算法。什么是特定环境呢?举个flappy bird的例子(博主的执念),flappy bird游戏的核心目标,就是使得玩家操作的鸟,不装到柱子上。作为人类,我们也会再游戏进程中无意或者有意的去发现一些规律,取得更高的分数。强化学习要做的就是将这种能力注意到学习算法上,也就是训练一个智能体(Agent)从深蓝击败国际象棋冠军,到Alpha Go,星际争霸和Dota2的原创 2020-05-22 21:54:52 · 651 阅读 · 0 评论 -
简介attention机制
被google备胎了,心情复杂,果然离Goole还是很远的……写篇文章吧。attention是为了解决在RNN过长的情况下导致,从图像领域引入到NLP领域中的。NLP领域的开篇之作,是Neural machine translation by jointly learning to align and translate,除此之外,推荐阅读这篇文章https://spaces.ac.cn/arc...原创 2020-05-21 22:49:10 · 326 阅读 · 0 评论 -
SVM 原理推导
介绍这篇博文写一些SVM的东西,首先的先对SVM原理做一个概述,之后对整个证明过程做一个梳理SVM 原理SVM旨在解决一系列分类问题。我们从几何意义来考虑分类问题的话,首先每一类都是多维空间的一个点,分类器就是在这个空间中中找到一个可以将每一类数据点分割开的超平面。比如果最简单的使用线性回归一类算法去寻找分类面,SVM同样是寻找分类面。在点数一定的情况下,分类面不只是有一个面,有很多个面的存...原创 2020-02-22 19:35:24 · 382 阅读 · 0 评论 -
机器学习笔记(一) 线性回归和logistic回归
最近吸收了不少机器学习方面的知识,写个笔记来总结一下:线性回归和logistics回归的目的我现在对机器学习的理解当然处于一个低维,简单的状态。与本人拙见,上述两种算法的目的是为了得到对应所有特征的权重。 我们来简单分析一下,CS229给了一个预测房价的例子,那么对应于我们从直观上理解的目的,也就是预测的房价。其产生的途径是输入的特征值和权重,然而我们想要的就是权重。所以说机器学习的主要目的其实就原创 2017-07-20 11:31:40 · 2714 阅读 · 0 评论 -
机器学习笔记(二) 神经网络
神将网络在解决多分类问题时效果比logistics回归的效果要好,作为现在最流行的机器学习算法,我们首先来简单了解一下:神经网络的组成:和我们人的神经组成一样,神将网络也是由神经元组成,先来介绍最普遍的MP神经元。 在生物的神经网络中,假设一些神经元处于兴奋状态,那么这些神经元就会向与之相连接的神经元发送化学物质,从而改变接受的神经元的电位,当这个电位达到一个阈值的时候,神经元就会兴奋,并进行下一原创 2017-07-21 12:36:40 · 330 阅读 · 0 评论 -
机器学习笔记(三) 随便实现的logistic回归
用tensorflow随便写了一个logistic回归的程序,结果还行 写这个程序的时候发现自己还不能尽可能地利用所学到的知识,还需多加练习,多看API才行import tensorflow as tfimport numpy as npalpha = 0.01;fp1 = open("ex2data1.txt","r")x = []y = []size = 0for line in f原创 2017-07-23 11:28:14 · 297 阅读 · 1 评论 -
机器学习笔记(四)卷积神经网络CNN
1.前言:卷积神经网络在计算视觉领域的表现十分出色,与普通的BP神经网络一样,CNN同样由神经元组成。其实卷积神经网络是卷积+神经网络,基本上由三部分组成:卷积层,pooling层,全连接层。2.CNN:卷积层卷积是一个信号领域的概念,我们这里提到的卷积是一个图像领域的概念。卷积的操作很是简单就是将一个小矩阵和大矩阵上某一点的邻域(大小与小矩阵相同)的对应位置的加权平均和,将这个和放到新的矩阵去。我原创 2017-07-25 13:35:48 · 1439 阅读 · 0 评论 -
简介循环神经网络家族
突然更新的机器学习系列……循环神经网络不管是RNN还是CNN,他们都是一种特征提取的手段,只不过CNN做的是提取空域的近邻信息,然而RNN是提取的时域上的上下文关系,我们经常在视频,文本这样具有明显的时间关系的数据来源上利用这种结构,根据任务的不同,我们可以把他垫在softmax后面做分类,或者是利用隐向量做翻译。上面是一个简单的RNN,对于任何一个hih_ihi,它的表达式为hi=f...原创 2019-09-19 11:33:49 · 215 阅读 · 0 评论