
计算机视觉
NineDays66
email:547691062@qq.com
展开
-
儿童手口眼异常识别
儿童手口眼异常识别原创 2022-11-04 12:40:29 · 1628 阅读 · 0 评论 -
人体检测算法,人流量统计,闯入分析
人体检测算法,人流量统计,人头计数应用环境:ARM 边缘设备、PC服务器设备人头检测在安防监控中是比较常用的功能,而公交车、商场或者大型场馆的拥挤人群计数的精准性也非常重要。算法思想作者称拥挤人群计数目前主要有两种实现路径:1.使用回归的算法思路,直接根据图像回归出拥挤人群密度热图,它的缺点是只能得到场景整体的一个拥挤指数,不能获知人群个体的具体位置,而且这种方法对图像分辨率很敏感。(52CV君曾经分享过:尺度不变网络提升人群计数性能(附Github地址))2.使用目标检测的方法,比原创 2021-06-17 13:44:58 · 4114 阅读 · 1 评论 -
Stacked Hourglass Networks - 堆叠沙漏网络结构详解
1.概述姿态估计(pose estimation)在计算机视觉领域是一个非常重要的方向,人类动作理解,人机互动等等应用都需要精确的姿态识别。目前,绝大多数的2d姿态识别都是识别人体的关键点,比如,给定一张普通的RGB图像,算法会给出人体的脚踝,胳膊,面部等区域的关键点(keypoint)目前,基于stacked Hourglass Model的各种变种算法,牢牢占据了姿态检测的半壁江山,所以,非常有必要搞清楚stacked hourglass model2.结构概览2.1 CNN的多层次特征CNN深原创 2021-06-04 11:11:13 · 4222 阅读 · 0 评论 -
车辆属性识别、车型识别
车辆属性识别目前在视频结构化模块是个比较难解决的部分,我们针对稀有车型做了很多优化,结果如下数据集相比于之前数据集的数据量对比情况 针对少量类别的样本进行相应的增加, 增加举例如下蓝色表示 原始少量的数据集, 黄色表示叠加的数据集数量,可以看出之前少量 数据集都有相对较多的增加。测试结构对比 - 样本少的品牌对比: 车辆结构化V1.0版本模型的结果如下:车辆结构化V2.0 版本模型的结果如下:整体正确率...原创 2021-01-21 17:00:21 · 6487 阅读 · 0 评论 -
OCR光学字符识别算法
应用场景身份认证使用身份证识别和人脸识别技术,自动识别录入用户身份信息,可应用于金融、保险、电商、O2O、直播等场景,对用户、商家、主播等进行实名身份认证,有效降低用户输入成本,控制业务风险最近基于OCR字符识别算法完成了身份证识别的应用,算法包括两块:字符检测+字符识别,算法已经移植到嵌入式设备,目前运行速度在200ms以内有兴趣的欢迎联系547691062@qq.com...原创 2020-12-11 10:41:53 · 154 阅读 · 0 评论 -
Attention 机制
SENet 详解https://blog.youkuaiyun.com/xjz18298268521/article/details/79078551图解1.基础网络结构2.各阶段计算方式公式3.结构图:简介为了更清楚地介绍计算机视觉中的注意力机制,这篇文章将从注意力域(attention domain)的角度来分析几种注意力的实现方法。其中主要是...原创 2019-10-29 11:13:30 · 1862 阅读 · 1 评论 -
MTCNN 解读
目录MTCNN解读 2数据与处理: 2第一阶段, 2第二阶段, 3第三阶段, 3基于caffe的mtcnn训练实现 5一、训练 5(1)样本问题: 6(2)网络问题 7二、训练步骤 8三、使用阶段 8视频车牌定位—mtcnn 9颜色定位和形态学定位改进后的mtcnn车牌定位算法 10MTCNN解读解读论文为《Joint Face D...转载 2019-06-07 21:10:48 · 5391 阅读 · 0 评论 -
HOG ,SIFT 特征实现
http://blog.youkuaiyun.com/q123456789098/article/details/52748918 讲的很清晰HOG特征:方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应...原创 2018-07-31 10:01:43 · 2707 阅读 · 0 评论 -
人脸-活体检测
攻击手段:(1)纸片翻拍,通过打印用户的照片进行攻击; (2)屏幕翻拍,一些3D建模技术可以驱动用户的单张照片或视频做出系统要求的摇头、张嘴、眨眼等动作;(央视报道的案例,采用的正是此原理)(3)用户戴面具。面对上述攻击手段,腾讯优图如何有效防范?针对以上攻击手段,腾讯优图依托多年的技术积累和实际业务运营经验,对人脸识别技术手段进行过多次安全升级...原创 2018-07-12 12:36:51 · 5491 阅读 · 1 评论 -
Opencv图像识别从零到精通(36)----DFT离散傅里叶变换
傅里叶变换 的应用离散傅立叶变换的一个应用是决定图片中物体的几何方向.比如,在文字识别中首先要搞清楚文字是不是水平排列的? 看一些文字,你就会注意到文本行一般是水平的而字母则有些垂直分布。文本段的这两个主要方向也是可以从傅立叶变换之后的图像看出来。我们使用这个 水平文本图像 以及 旋转文本图像 来展示离散傅立叶变换的结果 。水平文本图像:旋转文本图像:观察这两张幅度图...转载 2018-07-11 11:11:11 · 1541 阅读 · 0 评论 -
Optical Flow 理解
光流(optic flow)是什么呢?名字很专业,感觉很陌生,但本质上,我们是最熟悉不过的了。因为这种视觉现象我们每天都在经历。从本质上说,光流就是你在这个运动着的世界里感觉到的明显的视觉运动(呵呵,相对论,没有绝对的静止,也没有绝对的运动)。例如,当你坐在火车上,然后往窗外看。你可以看到树、地面、建筑等等,他们都在往后退。这个运动就是光流。而且,我们都会发现,他们的运动速度居然不一样?这就给...转载 2018-07-11 09:23:28 · 3240 阅读 · 0 评论 -
开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程
开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。姿态估计的任务旨在将RGB图像或视频的人像素映射到人体的3D表面。姿态估计是一个多任务任务,并涉及其他几个问题:物体检测,姿态估计,分割等。姿态估计的应用包括需要超越简单地标定位的问题,如图形,增强现实(AR)或人机交互(HCI)。姿态估计还涉及基于3D的物体识别的许多方面。在这篇文章中,我...转载 2018-06-27 10:54:04 · 4018 阅读 · 1 评论 -
局部响应归一化LRN(Local Response Normalization)理解
1、其中LRN就是局部响应归一化:这个技术主要是深度学习训练时的一种提高准确度的技术方法。其中caffe、tensorflow等里面是很常见的方法,其跟激活函数是有区别的,LRN一般是在激活、池化后进行的一中处理方法。 AlexNet将LeNet的思想发扬光大,把CNN的基本原理应用到了很深很宽的网络中。AlexNet主要使用到的新技术点如下。(1)成功使用ReLU...原创 2018-05-28 10:41:13 · 5244 阅读 · 0 评论 -
计算机视觉 2016 CV技术报告
The M Tank 编辑了一份报告《A Year in Computer Vision》,记录了 2016 至 2017 年计算机视觉领域的研究成果,对开发者和研究人员来说是不可多得的一份详细材料。该材料共包括四大部分,在本文中机器之心对第一部分做了编译介绍,后续会放出其他部分内容。内容目录简介第一部分分类/定位目标检测目标追踪第二部分分割超分辨率、风格迁移、着色动作识别第三部分3D 目标人体姿...转载 2018-05-16 10:35:19 · 841 阅读 · 0 评论 -
从RCNN到SSD 了解 目标检测算法
目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息。本文对目标检测进行了整体回顾,第一部分从 RCNN 开始介绍基于候选区域的目标检测器,包括 Fast R-CNN、Faster R-CNN 和 FPN 等。第二部分则重点讨论了包括 YOLO、SSD 和 RetinaNet 等在内的单次检测器,它们都是目前最为优秀的方法。机器之心之前...转载 2018-05-16 10:28:57 · 480 阅读 · 0 评论 -
2017年的 计算机视觉 发展
1.计算机视觉对于计算机视觉领域来说,贡献最大的当然是 CVPR 与 ICCV,其它如 IJCAI 等也有相关主题的获奖论文。这些获奖论文具体研究的方向主要有目标检测、图像标注、图像生成、语义分割、卷积神经网络架构等方面。今年唯一以研究卷积架构为主题的获奖论文是康奈尔与清华大学联合完成的 Densely Connected Convolutional Networks,他们发现如果卷积神经网络...原创 2018-05-16 10:20:00 · 1018 阅读 · 0 评论