
DL Learning
文章平均质量分 92
人生简洁之道
Glad to meet you
展开
-
骨架动作分析
文章目录全面综述:基于3D骨架的深度学习行为识别方法基于RNN的方法基于CNN的方法基于GCN的方法数据集全面综述:基于3D骨架的深度学习行为识别方法2020.2.14A Survey on 3D Skeleton-Based Action Recognition Using Learning Method传统的行为分析往往都是基于视频数据,近年来基于骨架的行为识别逐渐发展渐渐成为一个不大不小的领域骨架信息的获取可以使用 RGB,RGBD 或者 kinect 之类的传感器直接获取基于骨架信息的原创 2022-02-08 16:27:30 · 1521 阅读 · 0 评论 -
My DL-CodeBase 设计
Registry Mechanism构建字典(注册),keys为模块名,vals为模块类对象通过预定义的设置文件,读取模块名,进行实例化 (instantiating)符合 开闭原则,避免修改,方便扩展XX原创 2020-09-03 12:02:40 · 289 阅读 · 0 评论 -
黄金时代 —— 深度学习 (人脸检测识别)
MTCNN人脸检测 + 人脸对齐P-Net + R-Net + O-Net原创 2020-07-09 19:04:53 · 306 阅读 · 0 评论 -
黄金时代 —— Pytorch学习记录(三)
model.eval()和with torch.no_grad()的区别在PyTorch中进行validation时,会使用model.eval()切换到测试模式,在该模式下,主要用于通知dropout层和batchnorm层在train和val模式间切换在train模式下,dropout网络层会按照设定的参数p设置保留激活单元的概率(保留概率=p); batchnorm层会继续计算数据的mean和var等参数并更新。在val模式下,dropout层会让所有的激活单元都通过,而batchnorm层原创 2020-06-26 20:05:03 · 374 阅读 · 0 评论 -
TODO —— mmdetection
导言mmdetection:商汤科技和香港中文大学开源了一个基于Pytorch实现的深度学习目标检测工具箱mmdetection,支持Faster-RCNN,Mask-RCNN,Fast-RCNN等主流的目标检测框架,后续会加入Cascade-RCNN以及其他一系列目标检测框架相比于Facebook开源的Detectron框架,作者声称mmdetection有三点优势:performance稍高、训练速度稍快、所需显存稍小代码学习链接:Github包括有:Multiple Base Networ原创 2020-06-25 09:42:23 · 867 阅读 · 0 评论 -
黄金时代 —— Retinanet
文章目录简介DataLoader, DataSet, Sampler制作类似VOC格式的个人数据集介绍VOC数据集第一步:搞定JPEGSImages文件夹(`改名`)第二步:搞定Annatations文件夹第三步:搞定ImageSet/Main/*.txt文件第四步:生成相关CSV文件代码简介ResNet + FPN(将不同维度的特征整合在一起,提高信息的丰富度) + SubNet(class/regression:对anchor做平移和伸缩变换) + focal-loss仔细观察Retinane原创 2020-06-23 19:02:52 · 315 阅读 · 0 评论 -
黄金时代 —— Pytorch学习记录(二)
文章目录图片 - TorchVision定义模型使用预训练模型进行微调修改模型添加其他主干定义模型的4种方法目标检测风格迁移STNGAN并行/分布式训练Not Only Pytorch模型的生产部署 >> C++扩展Pytorch使用PyTorch C ++前端注解AutogradBroadcastCPU线程/TorchScript推理CUDA语义Pytorch的自定义模块大规模部署并行处理完全可重现的堵塞序列化的相关语义S/L问题图片 - TorchVisionPenn-Fudan数据库原创 2020-06-21 22:15:00 · 1219 阅读 · 0 评论 -
黄金时代 —— Pytorch学习记录(一)
文章目录TensorTensor操作桥接 NumPyCuda张量Autograd:自动求导张量梯度TensorTensor操作100多个函数randn, add_, view, numel桥接 NumPyTorch张量和NumPy数组将共享它们的底层内存位置,因此当一个改变时,另外也会改变:b = a.numpy(); a = torch.from_numpy(b)Cuda张量import numpy as npimport torch, osos.environ["CUDA_原创 2020-06-18 17:08:21 · 1416 阅读 · 0 评论 -
黄金时代 —— NAS技术学习
文章目录CNN模型压缩概述Deep compression 2016CNN模型压缩AutoML for Model Compression,AMCTensorFlow LiteNAS技术自动化神经架构搜索方法AutoMLNASNetMnasNet发展方向:NAS的搜索空间有很大的局限性。目前NAS算法仍然使用手工设计的结构和blocks,NAS仅仅是将这些blocks堆叠。人工痕迹太过明显,NAS还不能自行设计网络架构。NAS的一个发展方向是更广泛的搜索空间,寻找真正有效率的架构,当然对搜索原创 2020-06-15 15:47:47 · 614 阅读 · 0 评论 -
NLP知识普及 —— Encoder-Decoder 和 Seq2Seq
Encoder-DecoderEncoder-Decoder、Seq2Seq 以及他们的升级方案AttentionEncoder-Decoder 算是一个通用的框架,在这个框架下可以使用不同的算法来解决不同的任务Encoder-Decoder 这个框架很好的诠释了机器学习的核心思路:将现实问题转化为数学问题,通过求解数学问题,从而解决现实问题!Encoder:将现实问题转化为数学问题Decoder:求解数学问题,并转化为现实世界的解决方案PS:① 不论输入和输出的长度是什么,中间的「向量原创 2020-06-17 16:31:50 · 1296 阅读 · 0 评论 -
keras — YOLOv3 笔记
文件结构参考数据增强翻转变换flip随机修剪random crop色彩抖动color jittering平移变换shift尺度变换scale对比度变换contrast噪声扰动noise旋转变换/反射变换Rotation/reflection网络结构...原创 2020-06-08 22:05:15 · 386 阅读 · 0 评论 -
白铁时代 —— 机器学习进阶理解
文章目录混淆矩阵各指标的使用分析模型评估方法超参数调参模型比较三大损失函数线性回归和逻辑回归逻辑回归和SVM参数模型和非参数模型参数模型优缺点非参数模型优缺点SVM和LR的使用场景SVM如何选取核函数为什么说高斯核函数将原始特征空间映射成了无限维空间?高斯核δ\deltaδ的意义K-Means实现 anchor 划分机器学习算法的使用场景近邻算法/KNN贝叶斯决策时随机森林SVM逻辑回归判别分析 (Discriminant analysis)神经网络 (Neural network)BoostingBagg原创 2020-05-25 15:56:34 · 246 阅读 · 0 评论 -
Caffe在Windows平台下的编译及Matlab接口
Matlab 2017a + Caffe + Cuda10/Cudnn7.6.4 + Cmake 3.11主要问题:0 build_win.cmd文件修改 —— 直接Google吧1 libraries_v140_x64_py35_1.1.0.tar下载缓慢导致中断的问题 — 手动安装在Github相关网页上下载,放在C盘中.caffe路径中的相关位置并手动解压放在同级文件夹之下修改文...原创 2019-12-26 23:08:45 · 305 阅读 · 0 评论 -
Pytorch/Tensorflow随手记
pytorch中tensor变量,分成内存和逻辑索引(一些stride),.view()函数使变量的内存不变,而只是改变的逻辑语义;所以需要后接contiguous(),可以建立一个连续的内存空间,按照逻辑语义重新构造一个内存空间!...原创 2019-11-11 15:07:23 · 308 阅读 · 0 评论 -
深度学习随手记
Group Convolution最早来自于AlexNet,分组卷积是按卷积的通道进行分组,比如输入N通道,输出M通道,均分成K组,每组通道输入N/K,输出M/K,再将各组按照通道concatenate,例:参数量256x3x3x256 => 8x32x3x3x32 (N=M=32,K=8) 参数量降到1/8VGGnet 的 3x3 卷积小卷积有利于网络的加深!Inception 结...原创 2019-11-11 10:55:18 · 416 阅读 · 0 评论 -
论文阅读笔记 —— 两篇有意思的实例分割论文
Deep Watershed Transform for Instance Segmentation 2017Boundary-aware Instance Segmentation 2017Deep Watershed Transform for Instance Segmentation作者的基本思路是利用网络来学习分水岭算法里的energy map,目的是希望学习得到的water...原创 2019-11-07 14:37:01 · 591 阅读 · 0 评论 -
论文阅读笔记 —— SiamPRN++
参考原创 2019-11-06 16:11:32 · 695 阅读 · 1 评论 -
深度学习模块介绍 —— Hourglass Module
Hourglass ModuleHourglass模块设计的初衷就是为了捕捉每个尺度下的信息,因为捕捉像脸,手这些部分的时候需要局部的特征,而最后对人体姿态进行预测的时候又需要整体的信息。为了捕获图片在多个尺度下的特征,通常的做法是使用多个pipeline分别单独处理不同尺度下的信息,然后再网络的后面部分再组合这些特征,而作者使用的方法就是用带有skip layers的单个pipeline来保存...原创 2019-11-06 15:02:08 · 4331 阅读 · 1 评论 -
Anchor-free Object Detection - 13 papers
1/2 stages: 单步法的历史中从SSD和YOLO-2开始引入锚框(anchor box),而两步法直到Faster RCNN才开始采用“锚”的想法。Anchor: 固定的参考框,使得训练时可以预设一组不同尺度不同位置的锚框,覆盖几乎所有位置和尺度, 每个锚框负责检测与其区域交叉比(intersection over union, IOU)大于阈值的目标,这样问题就转换为"这个锚框中有...原创 2019-11-06 14:35:54 · 569 阅读 · 0 评论