
AI
文章平均质量分 80
blue_sky_wait_me
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Large-Scale Object Detection in the Wild from Imbalanced Multi-Labels
paper:Large-Scale Object Detection in the Wild from Imbalanced Multi-Labels这篇文章用的数据集是谷歌发布的 Open image dataset,它包含1.7m image 共 12.4m 个boxes 有 500 个类别。它主要是机器打标,然后人力修改,所以单个框的质量不高。(最近已经有了open image v4,更多了)摘要:Open Image主要是半监督的标注,所以有很大的提升空间。(感觉这么大的数据集用不上,只转载 2021-05-18 17:08:35 · 573 阅读 · 0 评论 -
YOLOv4训练自定义数据集
首先需要编译,cd到darknet-master目录下,make -j2需要改动的文件为darknet/src下的image.c文件找到draw_detections_v3函数,在第369行处:qsort(selected_detections, selected_detections_num, sizeof(*selected_detections), compare_by_probs); for (i = 0; i < selected_detections_num;...原创 2021-04-21 10:33:38 · 362 阅读 · 1 评论 -
KL散度(信息熵)
对于离散型随机变量,信息熵公式如下:对于连续型随机变量,信息熵公式如下:注意,我们前面在说明的时候log \loglog是以2为底的,但是一般情况下在神经网络中,默认以e ee为底,这样算出来的香农信息量虽然不是最小的可用于完整表示事件的比特数,但对于信息熵的含义来说是区别不大的。其实只要这个底数是大于1的,都能用来表达信息熵的大小。本篇我们来看看机器学习中比较重要的一个概念—相对熵。相对熵,又被称为KL散度或信息散度,是两个概率分布间差异的非对称性度量 。在信息论中,相对熵等价于两转载 2021-04-18 15:38:15 · 1672 阅读 · 0 评论 -
Corner Net
论文:CornerNet: Detecting Objects as Paired Keypoints论文链接:https://arxiv.org/abs/1808.01244代码链接:https://github.com/umich-vl/CornerNet这篇发表在ECCV2018上的目标检测文章给人一种眼前一亮的感觉,简单说一下几个比较吸引我的点:1、将目标检测问题当作关键点检测问题来解决,也就是通过检测目标框的左上角和右下角两个关键点得到预测框,因此CornerNet算法中没有anchor的转载 2021-04-08 15:44:04 · 181 阅读 · 0 评论 -
FPN
这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享。论文:feature pyramid networks for object detection论文链接:https://arxiv.org/abs/1612.03144论文概述:作者提出的多尺度的object detection算法:FPN(feature pyramid networks)。原来多数的object detection算法都是只采用顶层特征做预测,但我们知道低层的特征语义信息比较少,但是目标位转载 2021-03-29 15:44:06 · 96 阅读 · 0 评论 -
ssd
ssd(single shot detector)SSD结构图详细版本:SSD采用了特征金字塔结构进行检测,即检测时利用了conv4_3,conv_7(FC7),conv6_2,conv7_2,conv8_2,conv9_2这些大小不同的feature maps,在多个feature maps上同时进行softmax分类和位置回归。SSD多尺度特征映射细节:SSD算法中使conv4_3,conv_7,conv8_2,conv7_2,conv8_2,conv9_2,conv10_2,conv转载 2021-03-28 19:33:58 · 187 阅读 · 0 评论 -
R-FCN
1、R-FCN 设计的目的虽然Faster R-CNN把整个的检测过程集成到了一个可以end-to-end训练的网络,实现了大部分计算的共享,也极大的提高了检测速度。但是整个检测过程还是不够快,因为Faster R-CNN虽然使用了conv layers来共享特征提取,但是在RoI pooling提取每个RoI的feature map之后,要使用FC layer单独对每个RoI进行分类和回归,所以假设提取了128个RoI,那么就要使用FC layer进行128次的回归和分类,而且大家也都知道FC lay转载 2021-03-27 22:52:43 · 373 阅读 · 0 评论 -
Hyper Net
1.之前框架的问题目前的候选框提取方法通常需要提取几千个候选框,影响检测效率。RPN只提取了几百张,但是对于小物体的检测和定位仍存在问题。2.解决问题的要点深层次的卷积层:high recall, but poor localization低层次的卷积层:better localization, but reduced recall一个好的目标检测系统应该 combine the best of both3.HyperNet FrameworkHyperNet的框架如上图。图片转载 2021-03-25 16:33:30 · 314 阅读 · 0 评论 -
颜色直方图里面的bin(相当于刻度)
对于颜色直方图来说,横坐标是颜色空间(对应灰度直方图的灰度值),纵坐标是该颜色的像素点的数量。对于常用的RGB坐标一共有256x256x256=16777216种,这样横坐标过多,而且很多横坐标对应的像素点数量很少,整个直方图会很稀疏。因此将颜色空间划分为若干个小的颜色区间,对于每个颜色通道(R,G,B),每32个划分到一个bin里面,这样每个颜色通道就有8bins,也就是每个颜色通道只能取8个值了,那么由排列组合知,取法一共有8^3=512种。举个例子,假设一个像素的R,G,B,3个通道的取值分别为2转载 2021-03-02 16:03:44 · 1641 阅读 · 0 评论 -
关于颜色直方图
一、颜色距转自:https://blog.youkuaiyun.com/jaych/article/details/511373411、颜色距离颜色距离指的是两个颜色之间的差距,通常距离越大,两个颜色相差越大,反之,两个颜色越相近。在计算颜色距离时,有类似计算两点间欧式距离的公式一样,在RGB空间内,可以得到两个颜色之间的距离为:其中,C1 C2表示颜色1和颜色2,C1R表示颜色1的R通道。二、颜色直方图也就是说明某一像素值范围的像素点的个数,X轴为像素值,Y为个数。彩色直方图.转载 2021-03-02 15:29:49 · 2571 阅读 · 0 评论 -
linux系统下yolov4安装
当作笔记首先是python(感觉第一次就是因为用anaconda默认安装的3.8版本,然后numpy和opencv装不上去,后面又卸载python,导致系统崩了)这里用的python3.6版下面是链接https://www.python.org/downloads/source/然后是tar -zxvf Python-3.6.12.tgz (对源码进行解压)cd Python3.6.12./configure --prefix=/usr/local (配置...原创 2021-01-23 16:31:15 · 1066 阅读 · 4 评论 -
神经网络梯度下降过程中报错__init__() takes 1 positional argument but 4 were given
__init__() takes 1 positional argument but 4 were given....init 前后分别是2个下划线 一共4个实际上是重写初始化方法。如果原始的_init_,只有self一个参数原创 2020-12-29 11:24:15 · 777 阅读 · 0 评论 -
Windows7系统安装TensorFlowGPU和pytorch
Windows7系统安装TensorFlowGPU首先看N卡的适配cuda,我的是9.1,但是在英伟达官网上9.1版本是两年前出现的,我试了很多版本的TensorFlow,都失败了。然后重装9.0的cuda,找到合适cudnn,Python用anaconda配好的3.6,TensorFlowGPU用1.10.0版本。安装成功!(全部对应https://tensorflow.google.cn/install/source_windows)(下载TensorFlow-GPU:https://p原创 2020-12-22 10:54:36 · 133 阅读 · 0 评论 -
检验cuda是否安装成功,大写的V
nvcc -V看cuda是否安装成功,大写的V原创 2020-12-18 23:09:53 · 274 阅读 · 1 评论 -
python中执行py文件出错(提示File “<stdin>”,line 1,SyntaxError:invalid syntax)
python中执行py文件出错(提示File “<stdin>”,line 1,SyntaxError:invalid syntax)解决办法:上图中已通过输入python进入了python运行环境,出现>>>时候的不能再用python z.py 来运行hello.py文件;应该通过exit()退出当前python运行环境,然后再输入python hello.py来运行桌面上的hello.py文件;转载于:https://www.cnblogs.com/转载 2020-12-18 22:23:31 · 10305 阅读 · 1 评论