
图像处理
littletomatodonkey
work and life balance
展开
-
论文讲解:Knowledge distillation: A good teacher is patient and consistent
前言论文地址:https://arxiv.org/abs/2106.05237google的文章向来是不差钱,这篇文章也是如此,把ImageNet1k数据集的蒸馏做到了1W epoch,而且还做了大量的对比实验。虽然无法复现,不过能直接用结论也是ok的。量化裁剪和蒸馏是模型轻量化三板斧,裁剪可能会带来通道不平衡的问题,量化的收益稳定,这篇文章主要是对蒸馏展开研究。作者发现,只要给蒸馏足够的时间,他是能带来足够的惊喜的,最终只是基于该数据集,将ImageNet的结果刷到了82.8%。实验设置简原创 2021-10-22 11:12:10 · 1366 阅读 · 4 评论 -
PaddleClas-图像分类中的8种数据增广方法(cutmix, autoaugment,..)
本文主要来源于PaddleClas这个代码仓库中的数据增广文档:https://github.com/PaddlePaddle/PaddleClas/blob/master/docs/zh_CN/advanced_tutorials/distillation/distillation.md一、数据增广在图像分类任务中,图像数据的增广是一种常用的正则化方法,常用于数据量不足或者模型参数较多的场景。PaddleClas中将对除 ImageNet 分类任务标准数据增广外的8种数据增广方式进行简单的介绍和对.原创 2020-05-26 00:44:09 · 5520 阅读 · 5 评论 -
PaddleClas-图像分类模型TensorRT预测评估
简介在之前介绍分类模型的时候,大家除了比较精度之外,一般还会比较flops和params这两个参数,flops表示计算量,可以间接反映推理速度,params表示参数量,可以反映存储大小。但是有一个问题,flops相同的两个网络,它们的推理速度并不一定是相同的,因为可能有内存拷贝、通道拆分操作等其他差异。因此最好的方法就是直接在机器上预测,统计下耗时。T4 GPU是可用于模型推理的GPU显卡,支持TensorRT、FP32/FP16等多种推理类型,PaddleClas在其文档中给出了T4 GP上不同模型原创 2020-05-17 02:16:36 · 3055 阅读 · 1 评论 -
PaddleClas-SSLD知识蒸馏方法梳理(82.4%ResNet50系列模型养成之路)
简介PaddleClas是PaddlePaddle最近开源的图像分类代码库,里面包括了目前比较常用的分类模型,ResNet、HRNet、DenseNet、ResNeXt等,配置文件里也提供了这些模型的训练脚本,总共大概是117个模型,当然pretrained model权重文件也都给出来了,github地址在这里:https://github.com/PaddlePaddle/PaddleClas模型库其实还是比较丰富,不过里面最吸引人的可能还是ImageNet1k val数据集上**top1 acc原创 2020-05-16 17:38:33 · 3953 阅读 · 5 评论 -
deformable convnets V1&V2讲解
deformable convnets V1&V2讲解deformable convets主要是针对conv kernel形状固定的问题提出了解决方案,使得网络去自动学习这种kernel的形变,从而提升detection性能。我之前做了一些总结,具体讲解如下。也欢迎关注我的github:https://github.com/littletomatodonkey/littletomato...原创 2018-12-03 18:11:13 · 2924 阅读 · 0 评论 -
图像处理-常用特征点检测方法以及特征描述子
HOG(histogram of gradient)具体可以移步之前的文章:https://blog.youkuaiyun.com/u012526003/article/details/79966607sift(Scale-invariant feature transform)sift是用于描述图像中的局部特征,在空间尺度中寻找极值点,并且提取出其位置、尺度、旋转不变量,因此具有尺度和旋转...原创 2018-08-28 23:28:47 · 10564 阅读 · 0 评论 -
bounding box regression讲解
简介bbox回归指的是使用变换的方法,将当前预测的bbox进行变换,使其更加接近gt box。对于一般的bbox,可以由 x,y,w,hx,y,w,hx,y,w,h 4个变量进行表示,将我们的目标抽象为给定原始的proposal PPP,将groundtruth box记为GGG,我们希望能够找到一个变换关系,使得原始框可以映射得到一个更接近gt box的回归窗口G^G^\hat G。...原创 2018-08-28 22:51:57 · 1338 阅读 · 0 评论 -
卡尔曼滤波讲解
一些基础知识协方差系数与相关系数相关系数是用于刻画两个变量或者序列的变化趋势是相同的还是相反的,也可以判断这个相同或者相反的程度。设变量序列X与Y,则协方差系数计算为 Cov=E[(X−E(X))(Y−E(Y))]Cov=E[(X−E(X))(Y−E(Y))]Cov = E[(X-E(X))(Y-E(Y))] 如果2个变量是正相关的,则Cov>0Cov>0Cov>0,...原创 2018-08-19 19:09:22 · 913 阅读 · 0 评论 -
otsu自适应阈值方法实现
otsu方法讲解C++实现#include <iostream>#include <vector>#include <opencv2\opencv.hpp>#include <opencv2\highgui.hpp>using namespace std;using namespace cv;// ge原创 2018-08-01 15:47:03 · 1714 阅读 · 0 评论 -
HOG特征-梯度方向直方图
简介HOG特征主要是用于目标检测等图像任务中,它能够提取图像中有意义的部分,进而用于分类等任务。主要流程给定一张图像,我们可以将其转换为特定大小的图像(不转换也可以,这里假设得到的图像尺寸都是一样的,方便后续的说明),假设尺寸为W⋅H⋅3W⋅H⋅3W \cdot H \cdot 3 设置cell(大小为Cx⋅CyCx⋅CyC_x \cdot C_y),求每个cell的x与y方向...原创 2018-04-16 21:10:07 · 1132 阅读 · 0 评论