
深度学习
文章平均质量分 87
三寸光阴___
这个作者很懒,什么都没留下…
展开
-
image2image深度学习算法汇总
github上有一个比较全的汇总,主要是17~20年的:https://github.com/lzhbrian/image-to-image-papers。image2image方向比较多,有分割,超分辨率,去噪,去雨,去雾,风格迁移,raw2rgb(ISP)等,这里尽量挑一些比较经典的算法做一个汇总。SRCNN简介:SRCNN是首个使用CNN结构(即基于深度学习)的端到端的超分辨率算法,但是输入网络之前,对输入的低分辨率lr图像使用bicubic算法进行放大,网络比较浅。论文:https://ie原创 2021-03-26 11:27:45 · 3523 阅读 · 0 评论 -
基于Anchor Free的目标检测
总结:https://blog.youkuaiyun.com/weixin_36670529/article/details/1064688341.UnitBox: An Advanced Object Detection Network论文:代码:解析:2.DenseBox: Unifying Landmark Localization and Object Detection论文:代码:解析:3.You Only Look Once (YOLO) for Object Detection (YOL原创 2020-12-24 17:07:14 · 351 阅读 · 1 评论 -
大论文资料收集(人体姿态估计)
自己总结:https://blog.youkuaiyun.com/qq_38109843/article/details/102396365总结:https://blog.youkuaiyun.com/qq_36165459/article/details/78320535?locationNum=10&fps=1http://www.sohu.com/a/345995744_99979179...原创 2019-10-29 21:17:19 · 216 阅读 · 0 评论 -
yolo格式、voc格式、coco格式相互转换(xml,json,txt)
yolo转vockeras版yolov3训练格式是name box class这种形式,转voc格式使用一下代码,根据别人的代码改了一点。list.txt为yolo的标签,转换的voc格式的标签为.xml文件,都存放在Annotations下。from xml.dom.minidom import Documentfrom lxml.etree import Element, SubElem...原创 2019-06-04 17:18:28 · 20147 阅读 · 14 评论 -
阿里巴巴优酷视频增强和超分辨率挑战赛记录
之前做过超分辨率,刚好有这个比赛,拿来记录一下,截止目前初赛,score=40.22,排名46。数据官方给的txt,用于获取:y4m 格式介绍:https://wiki.multimedia.cx/index.php/YUV4MPEG2y4m 与 yuv(yuv420 8bit planar) 互转命令: y4mtoyuv: ffmpeg -i xx.y4m -vsync 0 xx...原创 2019-06-24 16:02:39 · 1459 阅读 · 4 评论 -
算法工程师笔试真题总结
牛客网旷视科技2019resnet-50:有多少个卷积层:参考答案:49(1) FLOPs = 2 * (C in * H k * W k + 1) * C out * H * W(2) Params = (C in * H k * W k + 1) * C out参考答案(1) 标 准 答 案 1( 直 接 计 算 ) : data[670617]-0.3441data[...原创 2019-07-24 12:13:47 · 3286 阅读 · 0 评论 -
tensorflow lite将ssd_mobilenet移植至移动端
准备工作下载tensorflow源码git clone https://github.com/tensorflow/tensorflow.git下载tensorflow modelgit clone https://github.com/tensorflow/models.git下载并安装bazel编译工具https://docs.bazel.build/versions/mast...原创 2019-08-09 10:27:27 · 1487 阅读 · 3 评论 -
实习学习笔记
正式开始实习了,每天做一个笔记便于复习8.27清除pip缓存指令:sudo rm -rf ~/.cache/pipMTCNN工作原理:https://blog.youkuaiyun.com/qq_36782182/article/details/83624357原创 2019-08-27 12:17:14 · 789 阅读 · 0 评论 -
faster rcnn inception_resnet_v2物品辨识比赛demo记录
使用tensorflow model里面的object detection训练的,因为没有时间限制,使用faster rcnn inception_resnet_v2识别10个类别,在1080ti上训练了5个小时,在1050上测试的,2s一张图片。定义 pascal_label_map.pbtxtitem { id: 1 name: 'cola'}item { id: 2 ...原创 2019-06-03 11:14:35 · 1829 阅读 · 0 评论 -
Deeplabv1、v2、v3、v3+总结、以及使用TensorFlow Model训练和测试DeepLabv3+
Deeplabv1模型结构1.VGG16的全连接层(FC层)转为卷积层(步幅32,步幅=输入尺寸/输出特征尺寸)2.最后的两个池化层去掉了下采样(目标步幅8)3.后续卷积层的卷积核改为了空洞卷积(扩大感受野,缩小步幅)4.在ImageNet上预训练的VGG16权重上做fine-tune(迁移学习)DCNN存在的问题 DeepLab的解决思路1.多次池化、下采样使输出信号分辨率变小:...原创 2019-06-06 09:17:35 · 4823 阅读 · 4 评论 -
目标检测yolo v1-v5总结
yolo v1这篇文章写的已经很好了,拿来做个笔记。核心步骤1.算法首先把输入图像划分成SS的格子,然后对每个格子都预测B个bounding boxes,每个bounding box都包含5个预测值:x,y,w,h和confidence。x,y就是bounding box的中心坐标,与grid cell对齐(即相对于当前grid cell的偏移值),使得范围变成0到1;w和h进行归一化(分别...原创 2019-04-15 17:49:35 · 3746 阅读 · 5 评论 -
RCNN,Fast RCNN,Faster RCNN,MaskRCNN总结
yolo系列的算法在这里添加链接描述原创 2019-04-15 20:51:02 · 19725 阅读 · 3 评论 -
语义分割算法总结
大论文准备写语义分割这方面的内容,先做个记录。FCN:Fully Convolutional Networks for Semantic Segmentation,Submitted on 14 Nov 2014主要特点:推广了端到端卷积神经网络在语义分割问题上的应用使用ImageNet预训练模型进行语义分割使用反卷积层进行上采样引入跳跃连接克服上采样的导致的粗糙结果。解释:全卷...原创 2019-04-16 22:12:15 · 2230 阅读 · 0 评论 -
深度学习公式推导
公式推导,待更新。原创 2019-04-16 22:13:07 · 1274 阅读 · 0 评论 -
ECCV2018 | 论文阅读CornerNet: Detecting Objects as Paired Keypoints
本文转自:https://blog.youkuaiyun.com/LLyj_/article/details/88900615 CornerNet论文阅读——CornerNet: Detecting Objects as Paired Keypoints文章目录CornerNet论文阅读——Corne...转载 2019-04-25 21:35:17 · 740 阅读 · 0 评论 -
计算机视觉算法岗面试题
大佬的面试经验:https://www.nowcoder.com/discuss/128148以及大佬的博客:https://blog.youkuaiyun.com/liuxiao214/article/details/83043170原创 2019-08-05 14:17:18 · 29040 阅读 · 5 评论 -
最新语义分割算法MS R-CNN、YOLACT小结
Mask Scoring R-CNN论文:https://arxiv.org/abs/1903.00241GitHub地址:https://github.com/zjhuang22/maskscoring_rcnnYOLACT论文:https://arxiv.org/abs/1904.02689GitHub地址: https://github.com/dbolya/yolact自己先简单做...原创 2019-05-16 11:12:36 · 7832 阅读 · 4 评论 -
crowhuman和object365比赛里的json、odgt、txt数据解析
crowhuman annotation_val.odgt标签解析import cv2import jsondata = {"ID": "273278,600e5000db6370fb", "gtboxes": [{"fbox": [67, 60, 333, 810], "tag": "person", "hbox": [203, 68, 86, 93], "extra": {"box_i...原创 2019-05-17 09:39:11 · 3373 阅读 · 0 评论 -
CornerNet-Lite论文笔记
论文链接:https://arxiv.org/pdf/1904.08900.pdf代码链接:https://github.com/princeton-vl/CornerNet-LiteCornerNet关于CornerNet论文解读在这里:https://blog.youkuaiyun.com/qq_38109843/article/details/89526785CornerNet主要思路是基于关键...原创 2019-06-05 10:55:36 · 1819 阅读 · 0 评论 -
深度学习面试知识小结
有时间自己整理一份。先copy一份别人的。CNN权值共享问题首先权值共享就是滤波器共享,滤波器的参数是固定的,即是用相同的滤波器去扫一遍图像,提取一次特征特征,得到feature map。在卷积网络中,学好了一个滤波器,就相当于掌握了一种特征,这个滤波器在图像中滑动,进行特征提取,然后所有进行这样操作的区域都会被采集到这种特征,就好比上面的水平线。CNN结构特点局部连接,权值共享,池化操作...原创 2019-03-31 19:04:57 · 6232 阅读 · 0 评论