- 博客(8)
- 收藏
- 关注
原创 AlphaGo Zero 与深度强化学习(一) 概述
AlphaGo Zero 与深度强化学习(一) 概述 原文: Mastering the Game of Go without Human Knowledge(2017)做的什么完全基于强化学习,使AlphaGoZero(下文简称 zero)通过自己的神经网络在很短的时间打败了前 AlphaGo。完全无人类数据干预。使用强化深度学习输入特征简单提到的的技术强化学习深度学习
2017-12-15 16:50:44
5504
原创 生成对抗网络(GAN)
生成对抗网络(GAN) paper原文:Generative Adversarial Networks生成对抗网络GAN概览做了什么优势不足模型组成生成模型 G鉴别模型 D核心公式算法图示化描述全局最优点 Pg Pdata效果与对比展望概览做了什么提出了新的模型对抗模型 通过生成模型(G)与鉴别模型(D)之间的相互竞争。即D模型要将 G 生成假数据调出,而 G
2017-11-24 15:43:34
4136
原创 神经网络基础—浅层神经网络
来源: coursera DeepLearningAI-Shallow Neural Network 课程的笔记整理浅层神经网络浅层神经网络层表达方式激活函数概述为何需要它常用激活函数的导数随机初始化参数向量层可以将计算中的每一步视为神经网络的一个层。隐藏层:不被观察到的层,大多数指在计算中未被表述的层。表达方式注意:输入不算层数。所以上层为一个2层神经网络a[layer
2017-11-22 19:40:22
714
原创 机器学习相关知识速查 - 持续更新
机器学习相关概念机器学习相关概念线性代数张量生成子空间范数特征分解奇异值分解SVDMoore-Penrose 伪逆迹运算概率与信息论概率随机变量概率分布边缘概率条件概率条件概率链式法则条件独立与独立性期望方差协方差常用概率分布伯努利分布BernoulliMulti-nouli 多项式分布正态高斯分布指数分布与拉普拉斯laplace分布Dirac 分布与经
2017-11-18 14:46:29
593
原创 机器学习-决策树
决策树目录决策树目录前景小合并大概述特点缺点什么是决策树表达方式根据路径方式递归方式定义算法总体思路代表算法Classification and Regression Tree CRT特性纯度损失函数regressionErrorclassificationErrorGini停止时机fully-grown tree 缺陷Regular 方法表达式可行的寻找
2017-11-18 14:37:07
370
原创 神经网络-逻辑回归
神经网络-逻辑回归目录神经网络-逻辑回归目录逻辑回归概念tips梯度下降绘制计算分析图方法逻辑回归中的梯度下降简单的算法描述矢量化tipsnumpy广播机制引起的隐形 bug 以及解决回顾深度学习训练步走逻辑回归概念定义:ŷ =σ(wTx+b)\hat y = \sigma(w^Tx+b) σ(z)=11+e−z\sigma(z) = \frac{1}{1+e^{-z}
2017-11-18 14:20:16
1040
原创 神经网络 - 概述
神经网络 - 概述目录神经网络 - 概述目录前景ReLu - 线性整流函数特性相比于传统机器学习分类神经网络输入数据基本分析方式分析图tips前景ReLu - 线性整流函数 y=max(0,f(x))y=max(0,f(x)) 开始一段是0,后面则为一条直线 被很多时候用于激活函数,取代了之前的S 函数 特性神经网络是由输入->神经元->输出基本逻辑组成
2017-11-18 14:18:07
476
原创 强化学习 - 概述
强化学习-概述 课程来自 Udacity-Reinforcement Learning(2017)- 1.Smoov & Curly’s Bogus Journey 的笔记整理强化学习的”Hello-world”规则绿色是目标红色是失败黑色是墙start是开始点你要找到一条从start到目标的路径思考如果给定一个附加概率:按着想法走的0.8,不按想法走的0.2。如果我们假定正确序
2017-11-18 13:49:00
2365
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人