
深度学习 (DL)
文章平均质量分 86
GoWeiXH
天道酬效勤
展开
-
损失函数、大数定律 and 中心极限定理
损失函数期望损失大数定律中心极限定理经验损失结构损失损失函数种类回归中的损失函数平方损失绝对损失Huber 损失Log-Cosh 损失分类中的损失函数0-1 损失Hinge 损失对数损失原创 2018-12-02 23:12:54 · 1179 阅读 · 0 评论 -
深度学习 - 处理序列的神经网络 (循环、长短时记忆、递归)
深度学习 - 处理序列的神经网络循环、长短时记忆、递归循环神经网络 RNN结构 and 计算过程反向传播梯度问题梯度消失 与 梯度爆炸激活函数长短时记忆 LSTM结构介绍公式推导递归神经网络 RNN介绍原创 2019-04-02 15:51:35 · 4691 阅读 · 0 评论 -
GoWeiXH:本博客内容导航
机器学习深度学习优化算法采样算法其他原创 2018-12-09 20:59:47 · 1139 阅读 · 1 评论 -
有偏估计 and 无偏估计 - 方差分母 n-1(详细证明)
有偏估计 and 无偏估计方差分母 n-1 - 详细证明均值 - 无偏估计方差 - 有偏估计方差 - 转换成无偏估计原创 2019-05-19 08:49:35 · 5278 阅读 · 4 评论 -
PyTorch 踩坑实录 (1) - 损失函数
今天开始更新学习 FaceBook 的深度学习框架 PyTorch !PyTorch 底层优化的非常好,而且与 Numpy 无缝对接,用起来很清爽,不像 TensorFlow 那么“反 Python”~先看了 Deep Learning with PyTorch: A 60 Minute Blitz ,题目说是“一小时搞定”,但就我这个上了岁数的人来讲,花了一晚上才把一整套流程跑了一遍。。。...原创 2019-05-12 22:14:47 · 585 阅读 · 0 评论 -
优化算法 - BGD、MBGD、SGD - 梯度下降
BGD (Batch Gradient Descent) 批量梯度下降,SGD (Stochastic Gradient Descent) 随机梯度下降,MBGD (Mini-Batch Gradient Descent) 小批量梯度下降。原创 2019-05-17 11:20:12 · 677 阅读 · 0 评论 -
特征工程 - 数据分析 - 峰度 and 偏度
特征工程 - 数据分析 - 峰度 and 偏度偏度峰度偏度偏度(Skewness)用来描述数据分布的对称性。当偏度 <0 时,称为负偏,数据出现左侧长尾;当偏度>0时,称为正偏,数据出现右侧长尾。正态分布是对称的,其偏度为 0。当数据偏度为 0 时,表示数据相对均匀的分布在平均值两侧,但不一定是正态分布。当偏度绝对值过大时,长尾的一侧出现极端值的可能性较高。下图...原创 2019-05-13 16:03:10 · 4423 阅读 · 0 评论 -
优化算法 - Momentum 动量 - 梯度下降 - 缓解山谷与鞍点的影响
优化算法Momentum 动量梯度下降缓解山谷与鞍点的影响MomentumNesterov原创 2019-05-17 15:52:02 · 1492 阅读 · 0 评论 -
优化算法 - Adagrad、RMSprop、Adam - 梯度下降 - 自适应学习率
优化算法梯度下降自适应学习率AdagradRMSpropAdam原创 2019-05-18 16:45:10 · 3928 阅读 · 0 评论 -
优化算法 - 牛顿法 and 拟牛顿法
优化算法 - 牛顿法 and 拟牛顿法预备知识无约束优化问题Hesse 矩阵泰勒展开式牛顿法形象化解释公式化解释算法过程拟牛顿法拟牛顿条件DFP (Davidon-Fletcher-Powell)算法推导算法过程BFGS (Broyden-Fletcher-Goldfarb-Shanno)总结原创 2019-04-07 13:22:34 · 794 阅读 · 0 评论 -
深度学习 - 卷积神经网络 CNN - 简述
深度学习 - 卷积神经网络 CNN层级结构数据输入层 Input Layer卷积计算层 Convolution Layer池化层 Pooling Layer全连接层 Full Connection Layer输出层 Output Layer原创 2019-04-01 20:27:08 · 859 阅读 · 0 评论 -
特征工程 - 特征变换、构造 and 选择
特征工程数值型归一化函数映射离散化类别型One-Hot编码(哑变量)序号编码二进制编码聚类处理统计决策树路径编码改变粒度时间型统计特征文本型词袋模型N-GramTF-IDF组合特征特征两两相互组合 + 选则决策树路径编码特征选择过滤型包裹型嵌入型原创 2018-11-28 15:56:49 · 984 阅读 · 0 评论 -
模型调优方法
模型调优方法参数调整效果优化过拟合欠拟合权重分析Bad-Case 分析原创 2018-12-03 10:06:03 · 4699 阅读 · 0 评论 -
邻近性的度量 (距离、相似度)
邻近性的度量距离、相似度简单匹配系数Jaccard 系数广义 Jaccard 系数距离余弦相似度皮尔森系数Bregman 散度选择正确的度量指标原创 2018-12-14 23:45:30 · 5286 阅读 · 1 评论 -
深度学习 - 模型调优经历(1)
模型调优经历背景遇到问题思路解决办法原创 2018-12-15 20:34:29 · 1662 阅读 · 0 评论 -
数据划分 - Hold-Out、K-Fold CV、Bootstrap
数据划分 Hold-Out、K-Fold CV、Bootstrap引入Hold-OutK-Fold CVBootstrap原创 2018-12-16 10:48:12 · 8039 阅读 · 0 评论 -
优化算法 - 梯度下降(导数、方向导数 and 梯度)
梯度下降(导数、方向导数 and 梯度斜率、导数 and 梯度斜率、导数偏导数方向导数梯度梯度下降反向传播原创 2018-12-16 21:32:48 · 2852 阅读 · 2 评论 -
L1、L2 正则项详解 - 解空间、先验分布、最大似然估计 and 最大后验估计
L1、L2 正则项详解(解空间、先验分布)引入直观看解空间先验分布最大似然估计最大后验估计原创 2018-12-11 22:25:38 · 4905 阅读 · 1 评论 -
深度学习 - 总述 and 训练技巧
深度学习 - 总述 and 训练技巧发展历史从感知器到神经网络深度学习训练技巧参数初始化DropoutBatchnormalization(BN)BN 的优势原创 2019-04-01 14:04:27 · 490 阅读 · 0 评论 -
深度学习 - 激活函数、梯度问题 and 损失函数
激活函数函数、导数 and 优劣SigmoidTanh (双曲正切)ReLU (Rectified Linear Unit,修正线性单元)LReLU (Leaky ReLU)ELU(指数线性单元)Maxout梯度消失与梯度饱和梯度消失梯度饱和反向传播平方差损失 and 交叉熵损失平方差损失交叉熵损失原创 2019-04-01 16:06:49 · 1216 阅读 · 0 评论 -
自然语言处理 - 要代替 RNN、LSTM 的 Transformer
自然语言处理 - 要代替 RNN、LSTM 的 TransformerTransformer 结构计算过程Seq2Seq 模型,通常来讲里面是由 RNN、GRU、LSTM 的 cell 来组建的,但最近 Google 推出了一个新的架构 Transformer. 这个模型解决了 Seq2Seq 模型依赖之前结果无法并行的问题,而且最终的效果也是非常棒。原文:图解 Transformer已经这...原创 2019-05-28 16:22:32 · 3612 阅读 · 0 评论