
Deep Learning
文章平均质量分 67
Arrow
在技术上具有Arrow一样的钉子精神
展开
-
深度学习模型部署
模型部署有以下模型格式ONNXNCNNOpenVINOTensorRTMediapipe。原创 2023-07-09 20:31:08 · 1433 阅读 · 0 评论 -
RTMPose
RTMPose原创 2023-07-01 16:41:05 · 4726 阅读 · 4 评论 -
网络及组件
网络及组件1. 简介2. BackBone3. Neck4. Head5. PostProcess1. 简介2. BackBone3. Neck4. Head5. PostProcess原创 2022-03-22 16:05:00 · 819 阅读 · 0 评论 -
数据集格式
数据集格式1. COCO数据集2. VOC数据集3. MOT数据集1. COCO数据集2. VOC数据集3. MOT数据集原创 2022-03-22 16:02:59 · 1497 阅读 · 0 评论 -
Kernel 1x1 卷积
Kernel 1x1 卷积1. 1x1卷积与3x3卷积的直观对比2. 1x1卷积与全连接的比较3. 1x1卷积的功能1. 1x1卷积与3x3卷积的直观对比使用Kernel大小为3x3的卷积使用Kernel大小为1x1的卷积2. 1x1卷积与全连接的比较3. 1x1卷积的功能...原创 2022-03-09 08:58:45 · 977 阅读 · 0 评论 -
多目标跟踪(MOT/MTT)
目标检测1. 网络组件1. 网络组件原创 2021-11-30 12:12:33 · 8347 阅读 · 2 评论 -
基于深度图像的动作识别
1. 简介1.1 动作识别分类基于深度信息 (相关论文)3d action recognition from novel viewpoints (2016)Global context-aware attention lstm networks for 3d action recognition (2017)Super normal vector for activity recognition using depth sequences. (2012)Joint angles simila原创 2020-05-19 11:37:34 · 2620 阅读 · 0 评论 -
目标检测综述
1. 目标分类-Classification解决“是什么?”的问题即给定一张图片或一段视频判断里面包含什么类别的目标定位-Location解决“在哪里?”的问题即定位出这个目标的的位置检测-Detection解决“是什么?在哪里?”的问题即定位出这个目标的的位置并且知道目标物是什么。分割-Segmentation分为实例的分割(Instance-leve...原创 2019-12-11 17:36:59 · 1288 阅读 · 0 评论 -
从数据中进行学习-基础知识
1. 大数据大数据是一种理念、一种解决问题的方法和一系列技术的集合。他与传统BI一样,都是从数据中挖掘有价值的信息,以满足商业目标;但它的独特之处在于:分布式、并行化。优秀的数据科学家需要具备的素质:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析\color{blue}{懂...原创 2018-02-27 09:27:53 · 1947 阅读 · 0 评论 -
25 Open Datasets for Deep Learning Every Data Scientist Must Work With
转自:https://www.analyticsvidhya.com/blog/2018/03/comprehensive-collection-deep-learning-datasets/ SOTA: state-of-the-artIntroductionThe key to getting better at deep learning (or most fields in...转载 2018-04-09 16:05:21 · 1130 阅读 · 0 评论 -
Google机器学习术语表
转自:https://developers.google.cn/machine-learning/glossary/?hl=zh-CN转载 2018-04-09 16:21:42 · 658 阅读 · 0 评论 -
Ubuntu 16.04编译安装TensorFlow 1.7.0 开发环境
1. Ref2. Clone TensorFlow repositoryClone TensorFlow repo with protobuf sub-modules$ git clone --recurse-submodules https://github.com/tensorflow/tensorflowcheckout需要的tag$ cd tenso...原创 2018-04-13 10:00:17 · 2244 阅读 · 1 评论 -
TensorFlow2.x 常用知识
1. 学习入门资源官方教程实验环境Google云盘2. 比赛天池大赛原创 2019-02-18 08:39:39 · 1552 阅读 · 0 评论 -
深度学习资料汇总
1. 入门 1) 掌握机器学习(初学者、从业人员、高级人员) 星级指数:三星 2) 2. 进阶原创 2016-07-04 14:46:13 · 2423 阅读 · 0 评论 -
Ubuntu 14.04 for Caffe 环境搭建
1. Ubuntu访问U盘 在Ubuntu下,如果U盘自动被挂载了,应该在/media/你的用户名/disk2. 使用U盘安装Ubuntu14.04 怎样制作ubuntu安装u盘3. Ubuntu14.04鼠标闪烁问题 Ubuntu14.04及以上操作系统鼠标闪烁问题4. 安装CUDA Toolkit4.1 下载cuda及安装指南 1)下载官方安装指南,后面的安装按照《NV...原创 2016-08-25 16:51:26 · 4908 阅读 · 1 评论 -
CNN的训练图像与测试图像不一致的多尺度问题
1. 传统检测和定位方法 对于检测和定位问题,最自然(也是最常用的方法)就是采用滑窗对每一个图像块进行检测,从而确定目标物体的位置。以上解决分类、检测和定位的方法有一个共同的地方,就是需要一个滑窗对整幅图像进行密集采样,然后处理每一个采样得到的图像块。传统的处理这些图像块的方法是一个接一个处理。但是,CNN有更便捷的做法。2. CNN检测和定位方法2.1 密集采样(滑窗)转载 2016-07-14 15:56:35 · 12322 阅读 · 1 评论 -
视觉识别(Visual Recognition)-- 总结
1. 基本概念1.1特征提取 特征提取:目前流行的方法是通过CNN来提取特征。 CNN网络越深,提取的特征越能表述目标的特征;CNN网络越深,就会遇到以下两个问题: 1)收敛问题(梯度消失或爆炸):可通过初始化优化方法和批量归一化方法(BN)来解决 2)准确度下降问题(网络越深,训练误差和测试误差越大):可通过深度残差学习(Deep Residu原创 2016-07-14 08:54:33 · 10679 阅读 · 3 评论 -
BP+SGD+激活函数+代价函数+基本问题处理思路
1. Sigmoid激活函数和交叉商代价函数2. Softmax激活函数和对数似然成本函数3. tanh激活函数原创 2016-05-13 16:49:16 · 8730 阅读 · 1 评论 -
特征降维-PCA(Principal Component Analysis)
1. 简介 PCA:Principal Component Analysis(主成分分析) 在进行图像的特征提取的过程中,提取的特征维数太多经常会导致特征匹配时过于复杂,消耗系统资源,不得不采用特征降维的方法。所谓特征降维,即采用一个低纬度的特征来表示高纬度。特征降维一般有两类方法:特征选择和特征抽取。特征选择即从高纬度的特征中选择其中的一个子集来作为新的特征;而特征抽取是指将原创 2016-07-19 16:39:46 · 1588 阅读 · 0 评论 -
对抗式网络(Adversarial Network)-深度学习突破的机会
1. 基本概念 2.原创 2016-07-30 11:45:12 · 6772 阅读 · 0 评论 -
LSTM和递归网络基础教程
转自:http://deeplearning4j.org/zh-lstm1. 简介 本文旨在帮助神经网络学习者了解递归网络的运作方式,以及一种主要的递归网络,即LSTM的功能和结构。 递归网络是一类人工神经网络,用于识别诸如文本、基因组、手写字迹、语音等序列数据的模式,或用于识别传感器、股票市场、政府机构产生的数值型时间序列数据。 递归网络可以说是最强大的神经网络转载 2016-08-04 08:55:52 · 4241 阅读 · 0 评论 -
深度学习框架的比较(MXNet, Caffe, TensorFlow, Torch, Theano)
1. 比较表2.详细描述原创 2016-07-29 14:22:08 · 51588 阅读 · 1 评论 -
cs231n学习笔记-CNN-目标检测、定位、分割
1. 基本概念1)CNN:Convolutional Neural Networks 2)2. CNN基本知识2.1 CNN的卷积流程 1)Activations maps的个数与Filter的个数一致。2)输入层与Filter、Padding、Stride、参数和输出层的关系原创 2016-07-11 09:02:10 · 57082 阅读 · 7 评论 -
机器学习常用缩略词
CVPR:Computer Vision and Pattern RecognitionECCV:European Conference on Computer VisionCOCO:Common Objects in ContextICCV:International Conference on Computer VisionIEEE:Institute of Electri原创 2016-07-11 14:14:42 · 2153 阅读 · 1 评论 -
本征向量、PCA和熵的基础教程
转自:http://deeplearning4j.org/zh-eigenvector1. 简介 本页主要以通俗语言和少量数学公式介绍本征向量及其与矩阵之间的关系,并且在此基础上解释协方差、主成分分析和信息熵。 本征向量(eigenvector)一词中的“本征(eigen)”来自德语,原意为a?自己的a。例如,在德语中,a?mein eigenes Autoa的转载 2016-08-04 16:07:35 · 4472 阅读 · 0 评论 -
手势估计- Hand Pose Estimation
1. 目前进展1.1 生成模型 1.2 判别模型 1)J. Tompson, M. Stein, Y. LeCun, and K. Perlin. Real-Time Continuous Pose Recovery of Human Hands Using Convolutional Networks. ACM Transactions on Graphics, 33原创 2016-07-17 19:12:24 · 28141 阅读 · 14 评论 -
Caffe学习笔记
1. 简介2. 前向传播(Forward) 从高层次到低层次的调用Forward函数:Solver->Net->Layer->Specific Layer (Convolution等...)3. 反向传播(Backward)原创 2016-08-17 08:44:33 · 3385 阅读 · 2 评论 -
三维重建
1. 基本概念 1)三维重建:就是指从2幅及2幅以上的图像中恢复空间点三维坐标的过程。 2)三维重建的三个关键步骤: - 图像对应点的确定 - 摄像机标定 - 2图像间摄像机运动参数的确定2. 图像的形成过程2.1 坐标系2.1 摄像机光学成像的四个步骤2.2原创 2016-08-12 11:31:45 · 4194 阅读 · 0 评论 -
RGB-D Camera 汇总
1. RGB-D Camera光照技术1.1 1.21.3 2. Kinect V1 vs Kinect V2是基础的数据结构,是用来保存学习到的参数以及网络传输过程中产生数据的类。原创 2016-09-27 09:54:42 · 27611 阅读 · 2 评论 -
机器学习数据集(Dataset)汇总
1. CIFAR-10 & CIFAR-100 CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。 (类别:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck) (作者:Alex Krizhevsky, Vinod Nair,原创 2016-07-05 09:27:36 · 25617 阅读 · 1 评论 -
cs231n学习笔记-激活函数-BN-参数优化
1. 简介 1)一次性设置(One time setup) - 激活函数(Activation functions) - 预处理(Preprocessing) - 权重初始化(Weight Initialization) - 正则化(Regularization) - 梯度检查(原创 2016-07-07 09:13:45 · 39382 阅读 · 6 评论