
深度学习
文章平均质量分 92
水果先生
Tencent AI
展开
-
深度学习 Ubuntu14.04环境搭建
首先,打开终端,运行以下命令确保你的操作系统是最新的sudo apt-get update sudo apt-get upgrade sudo apt-get install build-essential sudo apt-get autoremove原创 2016-12-30 15:45:01 · 684 阅读 · 0 评论 -
基于深度学习的视频检测(四) yolo-v2和darkflow
yolo-v1核心思想:从R-CNN到Fast R-CNN一直采用的思路是proposal+分类 (proposal 提供位置信息, 分类提供类别信息)精度已经很高,但是速度还不行。 YOLO提供了另一种更为直接的思路: 直接在输出层回归bounding box的位置和bounding box所属的类别(整张图作为网络的输入,把 Object Detection 的问题转化成一个 Regressio原创 2017-12-15 12:50:00 · 7052 阅读 · 0 评论 -
基于深度学习的视频检测(五) sort与deep_sort
sort论文地址:Simple Online and Realtime Trackingdeep_sort论文地址:Simple Online and Realtime Tracking with a Deep Association Metric原创 2017-12-15 13:48:31 · 9325 阅读 · 2 评论 -
基于深度学习的群体目标流量分析
群体目标流量分析大场景下(多摄像机 如正门、偏门)估计进出人数已有方法检测+跟踪过程首先检测人,之后用诸如粒子滤波、KCF等方式跟踪轨迹,判断了通过图像的虚拟线,进而决策缺点检测和跟踪都需要比较稳定,但是在一些密集场合检测是比较困难的,多目标的相互遮挡进行跟踪也是很困难的。线性特征拟合、特征回归缺点特别依赖于模型的学习,当场景换了、人走的速度原创 2018-02-02 21:51:25 · 2727 阅读 · 0 评论 -
机器学习 深度学习复习要点 面试题(更新中)
梯度下降前向传播和后向传播 前向传播 反向传播 梯度消失和梯度爆炸 Batch Normalization 随机梯度下降和 批量梯度下降 用 fminunc 函数对梯度下降算法进行高级优化除了梯度下降算法以外,还有一些常被用来令代价函数最小的算法,这些算法更加复杂和优越,而且通常不需要人工选择学习率,通常比梯度下降算法要更加快速。这些算法...原创 2017-12-06 21:28:04 · 1957 阅读 · 0 评论 -
CTPN/CRNN的OCR自然场景文字识别理解(一)
CTPN前言需阅读faster-rcnn相关摘要问题分析文字目标的特殊性,一个很大的先验是,文字总是水平排列的。文字的特征总感觉体现在edge上。自然场景文字检测的难点在于:小目标,遮挡,仿射畸变。本文使用VGG16,只使用conv5,可能对小文字的检测效果不好。文本检测和一般目标检测的不同——文本线是一个sequence(字符、字符的一部分、多字符组成的一个s...原创 2018-03-15 15:47:05 · 20998 阅读 · 2 评论 -
ssd 实现 文字识别 Textboxes
改进的SSD的地方:default box的长宽比进行修改(长条形),使其更适合文字检测(单词)作为classifier的卷积滤波器大小从3*3变成1*5,更适合文字检测SSD原来为多类检测问题,现在转为单类检测问题从输入图像为单尺度变为多尺度利用识别来调整检测的结果(text spotting)网络结构整个检测流程就是SSD+NMS,识别流程使用的CRNN。 ...原创 2018-03-15 21:15:53 · 2518 阅读 · 0 评论 -
CTPN/CRNN的OCR自然场景文字识别理解(二)
CRNN1) 端到端可训练(把CNN和RNN联合训练)2) 任意长度的输入(图像宽度任意,单词长度任意)3) 训练集无需有字符的标定4) 带字典和不带字典的库(样本)都可以使用5) 性能好,而且模型小(参数少)网络结构架构包括三部分: 1) 卷积层,从输入图像中提取特征序列; 2) 循环层,预测每一帧的标签分布; 3) 转录层,将每一帧的预测...原创 2018-03-15 21:33:14 · 9488 阅读 · 2 评论 -
从YOLO到SSD再到YOLO9000(一)
YOLO摘要YOLO之前的物体检测方法主要是通过region proposal产生大量的可能包含待检测物体的 potential bounding box,再用分类器去判断每个 bounding box里是否包含有物体,以及物体所属类别的 probability或者 confidence,如R-CNN,Fast-R-CNN,Faster-R-CNN等。YOLO不同于这些物体检测方法...原创 2018-03-14 12:36:18 · 4743 阅读 · 0 评论 -
从YOLO到SSD再到YOLO9000(二)
SSD摘要基于“Proposal + Classification” 的 Object Detection 的方法,R-CNN 系列(R-CNN、SPPnet、Fast R-CNN 以及 Faster R-CNN),取得了非常好的结果,但是在速度方面离实时效果还比较远在提高 mAP 的同时兼顾速度,逐渐成为 Object Detection 未来的趋势。 YOLO 虽然能够达到实时的效...原创 2018-03-14 14:55:08 · 1498 阅读 · 0 评论 -
从YOLO到SSD再到YOLO9000(三)
YOLOv2与YOLO9000摘要前篇介绍了基于回归方法的深度学习目标检测方法(YOLO,SSD),本篇将介绍YOLO的升级版YOLOv2,其主要有两个大方面的改进:(1) 使用一系列的方法对YOLO进行了改进,在保持原有速度的同时提升精度得到YOLOv2;(2) 提出了一种目标分类与检测的联合训练方法,通过WordTree来混合检测数据集与识别数据集之中的数据,同时在COCO和Ima...原创 2018-03-14 17:01:24 · 3004 阅读 · 0 评论 -
使用TensorFlow实现卷积与反卷积详细过程
卷积操作tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)除去name参数用以指定该操作的name,与方法有关的一共五个参数:input: 指需要做卷积的输入图像,它要求是一个Tensor,具有[batch, in_height, in_width, in_channe...原创 2018-03-24 15:46:12 · 6134 阅读 · 2 评论 -
基于深度学习的视频检测(二)
下图展示了机器对一个视频的认知效果。其总红色的字表示objects, 蓝色的字表示scenes,绿色的字表示activities。 人工智能在视频上的应用主要一个课题是视频理解,努力解决“语义鸿沟”的问题,其中包括了:视频结构化分析:即是对视频进行帧、超帧、镜头、场景、故事等分割,从而在多个层次上进行处理和表达。目标检测和跟踪:如车辆跟踪,多是应用在安防领域。人物识别:识别出视频中出现的人物原创 2017-09-22 11:35:49 · 13837 阅读 · 5 评论 -
基于深度学习的视频检测(一)
一、简介图像目标检测任务在过去几年深度学习的发展背景下取得了巨大的进展,检测性能得到明显提升。但在视频监控、车辆辅助驾驶等领域,基于视频的目标检测有着更为广泛的需求。由于视频中存在运动模糊,遮挡,形态变化多样性,光照变化多样性等问题,仅利用图像目标检测技术检测视频中的目标并不能得到很好的检测结果。如何利用视频中目标时序信息和上下文等信息成为提升视频目标检测性能的关键。对于视频目标检测来说,一个好的检原创 2017-09-04 16:47:44 · 44442 阅读 · 2 评论 -
基于深度学习的视频检测(六) 行人计数,监控视频人员管理
搭建 darkflow与 sort/deep_sort 环境修改 darkflow/net/yolov2/predict.pyimport numpy as npimport mathimport cv2import osimport jsonimport csv#from scipy.special import expit#from utils.box import BoundBo原创 2017-12-20 11:06:51 · 12319 阅读 · 6 评论 -
yolo v2 Ubuntu14.04 调整权重与分类需要调整的参数
关于搭建环境参考http://blog.youkuaiyun.com/samylee/article/details/53414108 关于设置VOC训练集格式进行训练http://blog.youkuaiyun.com/ch_liu23/article/details/53558549给了n类的训练集的训练权重,如何调整网格进行测试呢?首先需要修改./darknet/cfg/tiny_yolo_voc.cfg 调整[c原创 2017-05-17 11:36:51 · 1963 阅读 · 0 评论 -
配置完Caffe后配置CPU版本的faster-rcnn环境
下载项目,里面包含的caffe–rcnn与第一部分的caffe并不相同。git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git 安装cython和easydict:sudo pip install cython sudo pip install easydict 编译cython:到/py-faster原创 2017-06-26 14:44:24 · 2171 阅读 · 0 评论 -
win10+Anaconda+Tensorflow1.3+CUDA8.0+python3.5+pycharm+opencv3
1.准备安装包Anaconda3-4.2.0-Windows-x86_64;pycharm-community;CUDA:cuda_8.0.61_win10;下载时选择 exe(local)cuDNN:cudnn-8.0-windows10-x64-v6.0;如果你安装的TensorFlow版本和我一样1.3,请下载cuDNN v6.0 for CUDA 8.0 2.安装CUDA8.0装完后在cmd原创 2017-12-11 14:26:21 · 1675 阅读 · 0 评论 -
基于深度学习的视频检测(三) 目标跟踪
搭建环境Ubuntu16.04+CUDA9+cudnn7+python3.5+源码编译Tensorflow1.4+opencv3.3基于 darkflow (yolo-v2)和 sort/deep_sort 实现目标检测与追踪Real-time people Multitracker using YOLO v2 and deep_sort with tensorflow 安装依赖$sudo pip原创 2017-12-15 11:20:40 · 21133 阅读 · 38 评论 -
人脸关键点检测 ubuntu 16.04 + DLib + GPU(CUDA9 + cudnn7.0.5)
http://blog.youkuaiyun.com/tintinetmilou/article/details/76587088根据 dlib的文档,默认使用$ sudo pip install dlib安装的 dlib库,由于对具体硬件的要求( CPU需要支持 AVX指令集),是没有开启 AVX指令加速的,另外由于显卡的要求,也是默认不开启 CUDA的支持。这里介绍配置DLib的GPU加速版本需要先配置CU原创 2017-12-15 18:23:35 · 6768 阅读 · 0 评论 -
Ubuntu16.04+CUDA9+cudnn7+python3.5+源码编译Tensorflow1.4+opencv3.3
为了加快环境所需依赖的下载速度,首先更新 apt-get 源Ubuntu16.04[清华大学映像]如何修改默认的更新源呢:首先备份:$sudo cp /etc/apt/sources.list etc/apt/sources.list_backup修改:$sudo gedit /etc/apt/sources.list清空并替换为# 默认注释了源码镜像以提高 apt update 速度,如有需要可自原创 2017-12-14 22:14:06 · 4000 阅读 · 1 评论 -
Single Image Reflection Separation with Perceptual Losses
CVPR-2018摘要我们提出了一种从单个图像中分离 reflction(镜像)的方法。该方法使用了一个经过训练的全卷积网络,利用低级和高级图像信息进行端到端损失训练。我们的损失函数包括两种感知损失:一种是通过视觉感知网络的特征损失,另一种是 transmission layers 的图像特征编码的对抗性损失。我们还提出了一种新的 exclusion loss,实现像素层级的强制分离。...原创 2018-08-23 20:40:10 · 2111 阅读 · 0 评论