- 博客(60)
- 资源 (2)
- 收藏
- 关注
原创 Long-tailed Visual Recognition --Decoupled-Learning
有相当多的文献都将这个Decoupled-learning作为一种benchmark策略,特别是许多的jointly learning方法,在方法比较的时候都试图做Decoupled-learning以评估其有效性。比如Sinha等人做的CDB (IJCV)以及Difficulty-Net(arXiv)。
2022-10-11 22:31:41
430
原创 FastXML代码解读-done
FastXML是一种经典的极限多标签学习的方法,作者提供了完整的C++。先前编译成功并运行该代码,且添加了调试支持。本文将系统研究FastXML的代码。
2022-10-08 22:23:16
735
原创 FastXML代码编译和调试支持
FastXML代码编译和调试支持平台:windows + vscode编译器:cl.exe (MSVC 14.30.30705,推荐通过visual studio安装)
2022-09-20 17:44:52
344
原创 极限多标签学习之SwiftXML
1. FastXML是对特征空间进行划分,本文进一步拓展了PfastreXML以同时支持特征空间和标签空间。2. 将标签空间表征为word2vec embedding.
2022-09-16 21:53:01
553
3
原创 极限多标签之CRAFTML
本文提出了一种基于聚类的随机森林集成方法进一步提升了XMC的分类性能。关键点:(1) 对样本标签进行聚类,k个簇构成k个子节点。(2) 对样本和标签都进行低维映射,降低了计算复杂度。优点:实现简单,易于理解,不依赖复杂的优化scheme,计算复杂度低;缺点:不容易确定簇的个数。
2022-09-15 20:43:24
353
原创 极限多标签之-PfastreXML
本文提出了倾向性得分的损失,也是比较流行的评价指标。倾向性得分表征标签的稀缺性,同时本文认为比较稀缺的标签的重要性应该更高,因此标签的倾向得分是作为分母融入到nDCG中的。另外本文也提出了一个分类器用于处理tail labels,这基于作者的一个观点:FastXML的树状分类器还是容易在tail labels上赋予更低的概率。该分类器与树状分类器的结果加权平均,就得到了样本的最终分类结果。优点:利用倾向得分对missing label进行建模,似乎符合直觉。
2022-09-14 21:39:54
375
原创 极限多标签分类-评价指标
极限多标签分类的典型应用:Image Caption(头大)。由于标签数非常多,且GroundTruth又非常小,因此通常意义上的分类精度、召回(多标签分类用macro或者micro的acc或者recall)等指标不work。是指彼此相关的标签对,比如针对一个数据点,如果预测了标签A,如果标签B和A相关,那可以自然预测B。有些数据集包含一些频度很高的标签(通常称之为head labels),可以通过简单地重复预测头部标签来实现高的。标签数非常多(Million),典型的就是BoW数据标签。
2022-09-11 14:42:12
998
原创 《Bayes-Optimal Hierarchical Multi-label Classificaiton》-TKDE
This paper systematically concludes the classical loss functions for hierarchical multi-label classification (HMC), and extends the Hamming loss and Ranking loss to support class hierarchy.
2022-09-10 16:27:18
200
原创 概率统计基础
基本概率统计知识摘要:闲来无事,把基础的概率统计知识复习一遍,主要参考方开泰《统计分布》。文章目录基本概率统计知识事件和概率随机试验事件的运算概率及其公理化定义几种概率计算方法*概率的公理化定义条件概率独立性References随机变量及其分布离散型随机变量连续型随机变量分布函数随机变量的特征数数学期望方差高阶矩众数、分位点和中位数矩母函数与特征函数随机向量及其分布随机向量分布函数边缘分布和独立性条件分布事件和概率随机试验在一定条件下一定出现的现象叫必然事件,在一定条件下必然不出现的现象叫不可能事
2022-01-01 20:14:30
681
原创 目标跟踪方法调研
目标跟踪方法中科院长光所孙海江团队做了一些目标跟踪相关的工作,主要包括MeanShift方法改进,低小慢目标检测,滑动平均目标检测,纹理复杂度和信息熵,特征融合,红外弱小目标检测等等。 本文主要梳理了孙海江团队的工作。复杂背景灰度图像下的多特征融合运动目标跟踪 (2016)本文是对MeanShift方法的改进, 传统MeanShift方法主要是利用彩色直方图作为前景目标的特征, 然后进行逐帧匹配,达到跟踪的目的。 本文的主要算法模块如下:1. 对灰度图像, 利用Sobel算子求出梯度特征,并将梯度特
2021-12-24 11:06:27
896
原创 复杂动背景下的“低小慢”目标检测技术
复杂动背景下的“低小慢”目标检测技术,论文阅读和复现代码本文的目的是要检测低空中的慢速目标,我复现了本文算法(修正了一些模块),下面给出复现的细节。视觉显著性模型视觉显著性反应了人眼感知系统对视觉信号灯响应。原文给出的模型描述存在问题正确的模型如下:S(x,y)=∑i=0255fiC(I(x,y),i)S(x, y) = \sum_{i=0}^{255} f_i C(I(x, y), i)S(x,y)=i=0∑255fiC(I(x,y),i)其中,I(x,y)I(x, y)I(x,y
2021-12-24 11:05:54
1972
原创 目标跟踪-边缘跟踪
边缘跟踪算法实现过程网上大部分关于边缘跟踪的算法不是目标跟踪领域,而是串接目标的边缘,和区域生长法作用一样。极少有文献是关于目标跟踪领域的边缘跟踪算法。边缘跟踪算法主要包括4个步骤:帧间波门内差分;波门内阈值分割;波门内去噪声;计算边缘点(中心)前面三步和质心跟踪算法一样,第4步如果是计算单个边缘点,就是单边缘跟踪,如果是计算边缘点的中心,就是双边缘中心跟踪。这里以双边缘中心跟踪为例。帧间波门内差分相邻帧之间在波门内进行差分操作。为了仅体现相邻帧之间的变化量,这里我做了绝对值差分操作。
2021-12-23 20:55:40
2693
原创 Kalman Filter
贝叶斯滤波框架下的卡尔曼滤波卡尔曼滤波可以在贝叶斯滤波的框架下进行解释, 在讲解卡尔曼滤波之前, 我们先说说贝叶斯滤波.主要参考:https://blog.youkuaiyun.com/varyshare/article/details/97642209https://blog.youkuaiyun.com/varyshare/article/details/97642209https://www.cnblogs.com/ycwang16/p/5999034.htmlhttps://blog.youkuaiyun.com/weixi
2021-12-23 20:54:56
628
原创 局部对比度结合区域显著性红外弱小目标检测
《局部对比度结合区域显著性红外弱小目标检测》作者提出了一种区域局部对比度算法,仅在图像的显著性区域中进行局部对比度计算,而非遍历整幅图像。首先进行基于图像信息熵和局部相似性的红外图像区域显著性度量,经二值化得到单帧图像显著性区域;在该区域中进行局部对比度数值计算,得到区域局部对比度图像;最后经过自适应阈值分割,得到弱小目标检测结果;区域显著性度量本文提出的方法主要针对弱小目标的红外图像,对于人眼而言,弱小目标是红外图像中显著性较高,信息量大的区域。本文采用信息熵来度量图像区域信息量,图像中
2021-12-23 20:53:11
2708
原创 目标跟踪质心跟踪算法
质心跟踪算法实现过程这里目前只给出了CPU版本,GPU版本的后续补上。我在网上看的大部分质心跟踪算法不是正统的目标跟踪,而是在多目标跟踪中结合目标检测算法不同帧之间的相同目标做一个link。调研过程没有发现有相对比较完整的质心跟踪算法的实现,本文主要利用c++实现了质心跟踪算法,主要参考:https://wenku.baidu.com/view/ce958ce30a1c59eef8c75fbfc77da26924c59668.htmlhttps://wenku.baidu.com/view/047
2021-12-23 20:51:47
3444
5
原创 在vscode中使用opencv
在vscode中使用opencv2.4.12,在已安装opencv3.x的情况下之前我们讲了如何编译opencv2.4.12的方法,本文讲如何在vscode中使用opencv2412。实际上,由于ubuntu下面已经安装了opencv3.x版本,一般而言,opencv3.x在安装后,头文件一般会被放在/usr/local/include目录下面。opencv2.4.12编译后是不能make install的,否则会覆盖掉opencv3.x的目录,可能产生包的引用混乱问题。实际上,由于/usr/local
2021-12-23 20:50:56
4802
原创 Ubuntu20.04编译opencv-cuda
Ubuntu20.04编译opencv3.4.9 with CUDA10.2 support先前在编译opencv的时候,没有CUDA支持,本文介绍了opencv3.4.9添加CUDA支持的编译过程。OPENCV使用CUDA的文档可以参考:https://docs.opencv.org/3.4.9/da/d2c/tutorial_table_of_content_gpu.html编译前的准备工作:;从nvidia官网上下载Video_Codec_SDK,下载地址为https://develope
2021-12-23 20:49:20
2387
原创 Ubuntu安装opencv_contrib
Ubuntu+vscode+Opencv+Opencv_contrib C++ support环境搭建流程之前我们介绍了Windows搭建vscode opencv contrib的流程。由于后期需要用到linux开发,所以需要在linux上搭建相应的环境。本文完整介绍了如何在ubuntu环境下进行opencv环境搭建的流程。系统要求:ubuntu20.04:软件要求:vscode latest, opencv 3.4.9, opencv_contrib 3.4.9, mingw-w64, cmake
2021-12-23 20:48:32
3572
原创 ubuntu20.04编译opencv-2.4.12
ubuntu20.04编译opencv-2.4.12,与opencv349共存7月7日:由于需要对struck目标跟踪算法进行评估,而struck算法的官方实现需要用到两个指定版本的库,分别是Opencv 2.4.12以及Eigen3.2.6,所以需要在ubuntu20.04环境下额外编译opencv-2.4.12(以下简称opencv2412)。花了一天时间寻求解决办法,这个过程还是比较麻烦,现将自己踩过的坑记录如下。首先,假设我们已经安装了一个opencv 3.4.9的版本。且ubuntu上面有cm
2021-12-23 20:47:34
1958
原创 Ubuntu20.04安装nvidia驱动+CUDA tookit流程
Ubuntu20.04安装nvidia驱动+CUDA tookit流程文章目录Ubuntu20.04安装nvidia驱动+CUDA tookit流程切换nouneau驱动为nvidia驱动安装cuda tookit本文介绍了如何在ubuntu20.04系统下安装nvidia驱动+CUDA tookit的完整流程。切换nouneau驱动为nvidia驱动进入电脑BIOS(开机按钮+F1按键(联想台式机)),禁止Secure boot,然后F10保存重启。打开软件和更新–>附加驱动,确认
2021-12-23 20:45:40
812
原创 自动曝光算法原理介绍
自动曝光算法原理与实现介绍相机的自动曝光(AE)算法实际上是通过自动调整曝光时间,使得获取到的图像达到一个合理的灰度范围,比如140±20140\pm 20140±20。典型的判断灰度是否合理的方法是计算图像的灰度均值是否在140附近。图像像素均值计算设图像宽高分别为W,HW, HW,H, x,yx, yx,y处的灰度大小为Px,yP_{x, y}Px,y。图像左上角的点坐标为(x,y)=(0,0)(x, y) = (0, 0)(x,y)=(0,0)直接均值法直接计算均值:S=1WH∑x∑
2021-12-23 20:43:58
9467
转载 如何生成指定概率分布的随机数,MCMC采样方法
转载:https://cosx.org/2013/01/lda-math-mcmc-and-gibbs-sampling,写的由浅入深。列出一些纲要:在计算机内,产生均匀分布随机数的方法简单,线性同余。高斯分布,T分布,Gamma分布等分布类型的随机数可以通过均匀分布随机数来变换得到。复杂的,或者自己定义的概率分布的随机数可以通过MCMC采样方法得到。它是基于这样一个准则:可以通过构造Markov链的状态转移矩阵,使得该链的平稳分布恰好是你的概率分布。...
2020-07-16 14:40:57
1303
原创 cv2 imencode方法使用
之前一直很疑惑cv2的图像编码方法是如何使用的,做个总结。_, enc = cv2.imencode('.jpg', img)这个方法需要特别注意,img一定是一个BGR格式的uint8 ndarray。demo code:from PIL import Imageimport numpy as npimport cv2import base64from io import By...
2019-10-09 22:20:50
30156
6
原创 TFRecord读写
一个简单的写TFRecord示例import osimport tensorflow as tf# tf version: 1.12root_path = '/home/wuyanxue/Data/StandardTestImages/dataset/'train_path = os.path.join(root_path, 'train.txt')test_path = os.p...
2019-09-26 10:03:24
300
1
原创 彩色数字图像的表示
彩色数字图像的表示主要参考资料:http://read.pudn.com/downloads135/ebook/575313/%E5%BD%A9%E8%89%B2%E5%9B%BE%E5%83%8F%E5%A4%84%E7%90%86.pdfhttps://zh.wikipedia.org/wiki/HSL%E5%92%8CHSV%E8%89%B2%E5%BD%A9%E7%A9%BA%E9...
2019-09-16 21:22:41
2763
原创 数字图像的基本类型
数字图像的基本类型本文讲解10种图像文件的类型和相应的扩展名,主要参考:https://blog.hubspot.com/insiders/different-types-of-image-files.https://www.jianshu.com/p/4d8cace82028.https://www.cnblogs.com/Arvin-JIN/p/9133745.htmlVecto...
2019-09-16 21:20:29
3912
原创 不同卷积操作详解
不同卷积操作详解References:A guide to convolution arithmetic for deeplearning, Vincent Dumoulin and Francesco Visin;https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md.引言我们知道CNN在深度学习中占有举...
2019-09-16 21:17:46
1595
原创 Keras Basic Usage
Keras Basic UsageKeras是一个基于Python的深度学习库,是一个高级的神经网络API,可以运行在Tensorflow, CNTK, Theano等深度学习框架的顶层。对于研究者来说,使用Keras可以快速开发和构建深度学习模型。tf.keras是Google根据Keras API进行的Tensorflow版本的实现。官网上给出了一个非常简短的例子来介绍Keras的使用方法...
2019-09-11 22:23:45
234
原创 tensorflow冻结图转saved_model
tensorflow冻结图转saved_modelTensorflow有冻结图的protobuffer格式文件,这一个文件存储了图结构,并且将训练过程的变量转化为常量融入到其中。本文给出了将冻结图(frozen_inference_graph.pb)转化为saved_model格式的code,方便部署tf serving。# tf.__version__=1.12from tensorflo...
2019-09-11 22:15:31
3452
9
原创 DL图像增强方法--《DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks,2017》
DL图像增强方法–《DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks,2017》这篇文章提出了一个End-to-End的的DL方法,将普通的图片转化成单反质量的图片。论文内容介绍:http://www.vision.ee.ethz.ch/~ihnatova/ 要点:使用残差卷积网学习translati...
2019-09-11 22:03:45
1807
7
原创 Keras model部署服务--Flask
Keras model部署服务–Flask深度学习模型被训练后,需要将model部署为一个服务。本文给出一个利用flask部署keras model服务的demo。这个网络的Demo来自于TF的官网,首先引入相应的包:# Tensorflow classificationfrom __future__ import absolute_import, division, print_funct...
2019-09-11 22:01:07
905
3
原创 图像美化方法调研
图像美化方法调研参考资料:https://baike.baidu.com/item/%E5%9B%BE%E5%83%8F%E7%BE%8E%E5%8C%96/4143853https://www.cnblogs.com/sopic/p/4538052.htmlContrast Preserving Decolorizationhttps://blog.youkuaiyun.com/Trent198...
2019-09-11 21:20:38
1933
原创 SSIM, PSNR介绍
SSIM, PSNR介绍SSIMstructural similarity index是一种用以衡量两张数字图像相似度的指标。当其中一张为无失真的图片,另一张是失真图片时,二者的SSIM可以看成是失真图片的影响品质衡量指标。相比于PSNR,SSIM在图片品质的衡量上更能符合人眼对图片质量的判断。结构相似性的基本观点为图片是高度结构化的,相邻像素之间有很强的关联性。而这样的关联性体现了图像中物...
2019-09-11 21:13:54
3265
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人