
Deep Learning
文章平均质量分 58
ViatorSun
深度学习算法工程师,Github开源世界贡献者,专注于『计算机视觉、多模态大模型』领域
展开
-
详解 误差反向传播算法推导
误差反向传播算法误差反向传播算法(back propagation,简称BP模型)是1986年由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络。误差反向传播算法系统的解决了多层神经网络隐含层连接权学习问题,人们把采用这种算法进行误差校正的多层前馈网络称为BP网。BP神经网络具有任意复杂的模式分类能力和...原创 2020-02-22 19:57:02 · 40538 阅读 · 17 评论 -
深度学习的 “ 端到端模型(end-to-end learning)”
相对于深度学习,传统机器学习的流程往往由多个独立的模块组成,比如在一个典型的自然语言处理(Natural Language Processing)问题中,包括分词、词性标注、句法分析、语义分析等多个独立步骤,每个步骤是一个独立的任务,其结果的好坏会影响到下一步骤,从而影响整个训练的结果,这是非端到端的。而深度学习模型在训练过程中,从输入端(输入数据)到输出端会得到一个预测结果,与真实结果相比较...原创 2018-08-21 01:51:44 · 38880 阅读 · 14 评论 -
【解析】TensorBoard 可视化
在深度学习之中,可视化是必不可少的关键一步,虽然很多时候可以将需要的信息在输出窗口打印出来,但是能表达的信息是在太少,比如 loss趋势图、acc趋势图、权重分布图等等,都难以描述出来;Tensorboard 本是为了 Tensorflow而设计的一款可视化工具,后期 Pytorch 也引入支持,极大的小伙伴们的学习难度,虽然也有其他可视化工具支持,但是 Tensorboard可以直接迁移过来使用,上手还是更快。原创 2021-04-29 23:24:25 · 2188 阅读 · 0 评论 -
【BackBone】VGGNet复现 代码解析
Backbone 是对图像进行特征提取,这一部分是整个CV任务的根基,后续的下游任务都是基于提取出来的图像特征去工作。 因此Backbone是基石,也是开始CV学习的第一步~感兴趣的小伙伴可以关注我的专栏:【Paper】Backboneintro:ICLR 2015论文中文翻译:https://www.cnblogs.com/moeyu/p/14244065.htmlarXiv:Very Deep Convolutional Networks for Large-Scale Image Recogn原创 2021-04-04 15:20:01 · 812 阅读 · 0 评论 -
「解析」netron 模型可视化
Netron是神经网络、深度学习和机器学习模型的一款可视化工具Netron支持ONNX、TensorFlow Lite、Caffe、Keras、Darknet、飞浆、ncnn、MNN、Core ML、RKNN、MXNet、MindSpore Lite、TNN、Barracuda、Tengine, CNTK, TensorFlow.js, Caffe2 and UFF.Netron对PyTorch、TensorFlow、TorchScript、OpenVINO、Torch、Vitis AI、kmodel、Ar原创 2022-07-09 14:15:23 · 1442 阅读 · 0 评论 -
计算模型 FPS
无论是图像分类也好,目标检测/实例分割也罢,检测速度都是一个重要指标。计算模型FPS过程:只需要在模型运行前后各添加一个 time记录时间即可,然后通过时间差计算出模型 FPS原创 2022-07-06 16:02:02 · 4320 阅读 · 7 评论 -
如何在 CVPR 上查看 Papers
CVPRCVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议。是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECC...原创 2018-08-01 23:51:18 · 17162 阅读 · 11 评论 -
【解释】Word2vec 词嵌入
在NLP 里面,最细粒度的是 词语,词语组成句子,句子再组成段落、篇章、文档。所以处理 NLP 的问题,首先就要拿词语开刀。举个简单例子,判断一个词的词性,是动词还是名词。用机器学习的思路,我们有一系列样本(x,y),这里 x 是词语,y 是它们的词性,我们要构建 f(x)->y 的映射,但这里的数学模型 f(比如神经网络、SVM)只接受数值型输入,而 NLP 里的词语,是人类的抽象总结,是符号形式的(比如中文、英文、拉丁文等等),所以需要把他们转换成数值形式,或者说——嵌入到一个数学空间里,这种嵌原创 2021-02-06 20:45:10 · 320 阅读 · 0 评论 -
范数 为何物?
在机器学习 & 深度学习中常常用到范数,那么范数到底是干什么用的呢?其实范数的主要作用是衡量一个向量的大小,就是将向量映射到非负值的函数。直观讲就是:向量 xxx 的范数衡量 从原点到点 xxx 的距离。形式上,LpL^pLp 范数定义为:∥x∥p=(∑i∣xi∣p)1p\Vert x \Vert_p = \Biggl( \sum_i { \vert x_i \vert }^p \Biggr)^{\frac1p}∥x∥p=(i∑∣xi∣p)p11、欧几里得范数 – L2L原创 2021-01-17 12:07:27 · 334 阅读 · 0 评论 -
CNNs 入门论文汇总
本文主要总结了卷积神经网络在机器视觉领域的重要发展及其应用。我们将介绍几篇重要的公开发表的论文,讨论它们为何重要。前一半的论文(AlexNet到ResNet)将主要涉及整体系统架构的发展和演变,后一半论文将主要集中在一些有趣的子领域应用上。1、AlexNet (2012)这篇文章算是深度学习的起源(尽管有些学者认为Yann LeCun在1998年的论文 paper...原创 2020-05-17 20:40:35 · 9783 阅读 · 0 评论 -
基于TensorFlow的车牌识别系统 (附代码)
过去几周我一直在涉足深度学习领域,尤其是卷积神经网络模型。最近,谷歌围绕街景多位数字识别技术发布了一篇不错的paper。该文章描述了一个用于提取街景门牌号的单个端到端神经网络系统。然后,作者阐述了基于同样的网络结构如何来突破谷歌验证码识别系统的准确率。为了亲身体验神经网络的实现,我决定尝试设计一个可以解决类似问题的系统:车牌号自动识别系统。设计这样一个系统的原因有3点:转载 2018-09-24 19:56:49 · 15362 阅读 · 13 评论 -
深度学习 如何查看 GPU使用情况
正确的了解主机 GPU的使用情况,才能更好的给程序分配合适的 BatchData,以下提供 Win10系统与 Ubantu系统下的查询GPU使用情况的方法。原创 2020-08-04 23:22:57 · 8730 阅读 · 2 评论 -
Keras 识别验证码
使用深度学习来破解 captcha 验证码本项目会通过 Keras 搭建一个深度卷积神经网络来识别 captcha 验证码,建议使用显卡来运行该项目。下面的可视化代码都是在 jupyter notebook 中完成的,如果你希望写成 python 脚本,稍加修改即可正常运行,当然也可以去掉这些可视化代码。Keras 版本:1.2.2。captchacaptcha 是用 python 写的生...原创 2019-10-02 18:43:24 · 1616 阅读 · 3 评论 -
维度灾难
在机器学习中,经常会听到维度灾难问题,那么什么是维度灾难呢? 当数据的维度增高时,很多机器学习问题就变得相当困难,这种现象就是维度灾难。维度灾难发生在计算机科学的许多地方,但是在机器学习中尤其如此。在机器学习中我们需要设定模型的特征值,而每一个特征值又含有不同的数值代表不同类别。在机器学习的过程中,为了更好的区分数据,我们往往会增加模型的特征值维度(即特征值得个数),如下图所示,...原创 2018-09-05 10:26:50 · 3214 阅读 · 1 评论 -
期货量化交易实例
量化交易是用数学模型替代人的主观判断,通过使用计算机从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少投资者因为情绪波动而造成的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。在这里推荐个组织:http://tushare.org 。Tushare是一个免费、开源的python财经数据接口包。Tushare: 主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大原创 2019-01-21 16:31:01 · 4941 阅读 · 0 评论 -
深度学习第一课:极简入门
本场 Chat 主要目标是立足于前人肩膀上,从整体上来总览深度学习,图文并茂的解释深度学习概念。适合想转战深度学习的小伙伴,以及刚刚入门深度学习,却为深度学习开发流程而困惑的小伙伴们。本场 Chat 主要内容:何为深度学习;分类问题与回归问题;监督学习与无监督学习;学习及开发流程;最小神经元;激活函数;学习规则;Softmax;应用场景;如何选择对应的算法。1、前...原创 2018-07-16 15:34:04 · 1462 阅读 · 0 评论 -
激活函数:sigmod、tanh、ReLU、ELU、PReLU
1. sigmod函数函数公式和图表如下图 在sigmod函数中我们可以看到,其输出是在(0,1)这个开区间内,这点很有意思,可以联想到概率,但是严格意义上讲,不要当成概率。sigmod函数曾经是比较流行的,它可以想象成一个神经元的放电率,在中间斜率比较大的地方是神经元的敏感区,在两边斜率很平缓的地方是神经元的抑制区。当然,流行也是曾经流行,这说明函数本身是有一定的缺陷的。1)...原创 2018-09-05 16:11:13 · 8422 阅读 · 1 评论 -
深度学习常用优化算法:SGD、Nesterov、Adagrad、AdaDelta、Adam
优化算法的功能,是通过改善训练方式,来最小化(或最大化)损失函数E(x)。模型内部有些参数,是用来计算测试集中目标值Y的真实值和预测值的偏差程度的,基于这些参数,就形成了损失函数E(x)。比如说,权重(W)和偏差(b)就是这样的内部参数,一般用于计算输出值,在训练神经网络模型时起到主要作用。在有效地训练模型并产生准确结果时,模型的内部参数起到了非常重要的作用。这也是为什么我们应该用各种优化策略和算法,来更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值。原创 2018-09-03 16:04:12 · 14274 阅读 · 1 评论