
CV
文章平均质量分 86
CV
J ..
行百里者半九十.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于 OpenVINO, yolov5 推理
OpenVINO 是英特尔开发的跨平台深度学习工具包。该名称代表“开放式视觉推理和神经网络优化”。OpenVINO 专注于通过面向英特尔硬件平台的一次写入、随处部署的方法优化神经网络推理。● OpenVINO 工具包,由开源社区支持● Intel Distribution of OpenVINO toolkit,由 Intel 支持。原创 2024-01-21 01:49:50 · 1249 阅读 · 0 评论 -
Tensorrt 实现 yolov5-cls 遇到的问题
yolov5-6.2增加了分类训练、验证、预测和导出(所有 11 种格式),还提供了 ImageNet 预训练的 YOLOv5m-cls、ResNet(18、34、50、101) 和 EfficientNet (b0-b3) 模型.原创 2023-11-22 00:17:09 · 496 阅读 · 0 评论 -
yolov8x-p2 实现 tensorrt 推理
yolov8x-p2, tensorrt 实现.原创 2023-10-23 23:00:21 · 1992 阅读 · 4 评论 -
实时语义分割网络 BiSeNet 训练自定义数据集
BiSeNet是一种新的双向分割网络,设计了一个带有小步长的空间路径来保留空间位置信息生成高分辨率的特征图;同时设计了一个带有快速下采样率的语义路径来获取客观的感受野。在这两个模块之上引入一个新的特征融合模块将二者的特征图进行融合,实现速度和精度的平衡。原创 2023-08-13 01:40:27 · 610 阅读 · 0 评论 -
HRNet 训练自定义数据集
基于 MMPose, 实现训练自定义数据集.原创 2023-04-02 23:27:24 · 1805 阅读 · 0 评论 -
基于 NCNN, 实现 yolov8
记录下 基于 ncnn 实现 yolov8 的全部过程。原创 2023-04-02 22:58:02 · 3116 阅读 · 4 评论 -
Tensorrt 实现 yolov5x + dcnv2
由于固定的几何结构,CNN固有地限制了模拟几何转变。本篇论文我们引入了两个模块来加强CNN转变模拟能力,称之为可变卷积和可变Roi 池化。这些都是基于,在没有额外监督的情况下,通过额外的偏移量来增加模块中的空间采样位置,并从目标任务中学习偏移量。新模块可以替换CNN中的普通模块,并且能通过标准的反向传播进行端到端训练,得到的成为可变卷积网络。大量实验表明这个模块性能确实有提升。原创 2023-03-21 01:04:05 · 2106 阅读 · 2 评论 -
windows 基于 MediaPipe 实现 Holistic
MediaPipe Holistic pipelines 集成了姿势、面部和手部组件的独立模型,每个组件都针对其特定领域进行了优化,每个组件的推断输入图不同。MediaPipe Holistic 首先通过 BlazePose 的姿势检测器和后续的关键点模型来估计人的姿势。然后,利用推断出的姿势关键点,为每只手和脸部推导出三个感兴趣区域(ROI)裁剪,并采用 re-crop 模型来改进 ROI然后,pipelines 将全分辨率输入帧上裁剪这些 ROI,并应用特定任务的模型来估计它们对应的关键点。原创 2022-12-11 22:00:46 · 1967 阅读 · 3 评论 -
搭建 HRNet-Image-Classification,训练数据集
This is the official code of high-resolution representations for ImageNet classification.原创 2022-11-23 13:35:55 · 728 阅读 · 0 评论 -
基于SCRFD,训练人脸数据集
SCRFD is an efficient high accuracy face detection approach which initially described in Arxiv, and accepted by ICLR-2022.原创 2022-10-22 01:22:41 · 1611 阅读 · 0 评论 -
yolov7 训练 和 tensorrt 实现
YOLOv7 在 5 FPS 到 160 FPS 范围内,速度和精度都超过了所有已知的目标检测器,并在 GPU V100 上,30 FPS 的情况下达到实时目标检测器的最高精度 56.8% AP。YOLOv7 是在 MS COCO 数据集上从头开始训练的,不使用任何其他数据集或预训练权重。原创 2022-09-14 00:21:28 · 1815 阅读 · 0 评论 -
基于Tensorrtx 实现 darknet Yolov4-tiny 模型
基于tensorrt , 实现 darknet版 yolov4-tiny原创 2022-08-26 23:20:44 · 693 阅读 · 12 评论 -
HRNet-Facial-Landmark-Detection 训练自己数据集
微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人脸关键点检测的性能。原创 2022-07-27 01:03:23 · 1970 阅读 · 27 评论 -
rpi4 实现 qiuqiu - Ultralight-SimplePose
qiuqiu Ultralight-SimplePose:https://github.com/dog-qiuqiu/Ultralight-SimplePose💻 OSLinux raspberrypi 5.10.60-v8+ #1448 SMP PREEMPT Sat Aug 21 10:48:18 BST 2021 aarch64 GNU/Linux⚡️ 安装 protobuf sudo apt-get install autoconf automake libtool git clo.原创 2022-05-02 23:03:13 · 805 阅读 · 0 评论 -
windows 基于 MediaPipe 实现 HandTracking
The ability to perceive the shape and motion of hands can be a vital component in improving the user experience across a variety of technological domains and platforms. For example, it can form the basis for sign language understanding and hand gesture co.原创 2022-01-13 23:31:06 · 4184 阅读 · 21 评论 -
windows 基于 MediaPipe 实现 IrisTracking
谷歌日前发布了用于精确虹膜估计的全新机器学习模型:MediaPipe Iris。所述模型以MediaPipe Face Mesh的研究作为基础,而它无需专用硬件就能够通过单个RGB摄像头实时追踪涉及虹膜,瞳孔和眼睛轮廓的界标。利用虹膜界标,模型同时能够在不使用深度传感器的情况下以相对误差小于10%的精度确定对象和摄像头之间的度量距离。请注意,虹膜追踪不会推断人们正在注视的位置,同时不能提供任何形式的身份识别。MediaPipe是一个旨在帮助研究人员和开发者构建世界级机器学习解决方案与应用程序的开源跨平台..原创 2021-12-30 00:20:24 · 4112 阅读 · 11 评论 -
Tensorrt 加速 OpenPose
关于OpenPose OpenPose人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以caffe为框架开发的开源库。可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,基于它的实例如雨后春笋般涌现。人体姿态估计技术在体育健身、动作采集、3D试衣、舆情监测等领域具有广阔的应用前景,人们更加熟悉的应用就是抖音尬舞机。OpenPose项目Github链接:https://github.c.原创 2021-09-11 16:13:30 · 1566 阅读 · 2 评论 -
windows 基于 MediaPipe 实现 PoseTracking
MediaPipe是用于构建跨平台多模态应用ML管道的框架,其包括快速ML推理,经典计算机视觉和媒体内容处理(如视频解码)。在2019年6月举行的CVPR大会,MeidaPipe正式开源,版本是v0.5.0。自那以后,谷歌陆续发布了一系列的ML管道示例。 日前,谷歌撰文介绍了又一个MediaPipe示例:Object Detection and Tracking。谷歌首次描述了新发布的Box Tracking解决方案,并解释了它是如何与Object Detection结合并提供一个对象检测与追踪系统。.原创 2021-07-29 14:45:18 · 9948 阅读 · 66 评论 -
window10 基于 Tesseract,实现 ocr 识别
关于 window下编译 Tesseract,一些步骤忘记了,这里简单记录下过程,详细编译过程,请参考下面提供的链接文章。本文主要讲解如何在训练时候,解决出现 " couldn’t find a matching blob" 错误。Tesseractwindow编译编译下载 cmake , cppan ( https://cppan.org/client/)编译 tesseract 之前, 需编译 leptonica(1.76.0) , libpng , libjpeg...原创 2021-04-23 23:51:14 · 1022 阅读 · 0 评论 -
win10下 安装 Detectron2(0.4) (VS2019 + cuda11 + pytorch1.8)
Detectron2是 Facebook AI Research 推出的第二代CV库,它不但进一步集成了最新的目标检测算法,,而且是对先前版本 Detectron 的完全重写,号称目标检测三大开源神器之一(Detectron2/mmDetection(MMDetection专栏开篇)/SimpleDet)。源自最初的maskrcnn-benchmark库。原创 2021-03-23 00:42:26 · 4012 阅读 · 18 评论 -
基于opencv ,实现螺丝松动检测
目前地铁上检修螺丝后,会涂抹一种红色标记线,来代表检测完成,日后检修员就可以通过肉眼来观察螺丝是否松动,这样可以大大提高检修的效率问题。所以我们参照这个思路,通过opencv来实现螺丝是否松动检测。原创 2021-02-19 22:30:26 · 9072 阅读 · 22 评论 -
基于TensorRT C++ API 实现 tensorflow examples 中 speech_commands
在TensorRT 中实现 tensorflow examples 中 speech_commands。原创 2020-12-12 23:23:20 · 639 阅读 · 3 评论 -
基于TensorRT C++ API 加速 TF 模型
在推理过程中,基于 TensorRT 的应用程序的执行速度可比 CPU 平台的速度快 40 倍。借助 TensorRT,您可以优化在所有主要框架中训练的神经网络模型,精确校正低精度,并最终将模型部署到超大规模数据中心、嵌入式或汽车产品平台中。TensorRT 以 NVIDIA 的并行编程模型 CUDA 为基础构建而成,可帮助您利用 CUDA-X 中的库、开发工具和技术,针对人工智能、自主机器、高性能计算和图形优化所有深度学习框架中的推理。TensorRT 针对多种深度学习推理应用的生产部署提供 IN原创 2020-11-27 17:49:37 · 1382 阅读 · 11 评论 -
Ubuntu 18.04 CPU 安装 OpenCL
由于 Windows 驱动中自动包含了OpenCL驱动,但 Linux系统需要自己安装OpenCL驱动。所以 ,一开始在虚拟机中搭建Ubuntu 18.04 环境,但无论怎么搞都找不到核显,索性放弃,在电脑装了个ubuntu18.04 系统,重新搞,果然成功了,貌似是虚拟机中找不到核显 ,具体原因不详。一: 系统Intel(R) Core(TM) i7 8550U +Intel(R) UHD Graphics 620二:安装 下载 OpenCl SDK https:...原创 2020-06-15 22:40:07 · 6349 阅读 · 6 评论 -
基于人脸特征点实现疲劳检测
为了有效监测驾驶员是否疲劳驾驶、避免交通事故的发生,提出了一种利用人脸特征点进行实时疲劳驾驶检测的新方法。对驾驶员驾驶时的面部图像进行实时监控,首先检测人脸,并利用ERT算法定位人脸特征点;然后根据人脸眼睛区域的特征点坐标信息计算眼睛纵横比EAR来描述眼睛张开程度,根据合适的EAR阈值可判断睁眼或闭眼状态;最后基于EAR实测值和EAR阈值对监控视频计算闭眼时间比例(PERCLOS)值度量驾驶员主...原创 2020-04-29 13:35:51 · 14029 阅读 · 36 评论 -
VS2017 使用 tensorflow examples 中 speech_commands,训练自己数据集
使用 TensorFlow 官方提供的 speech_commands 语音分类模块,训练自己数据集。详细文档请参考:https://blog.youkuaiyun.com/rainhurt/article/details/89097842 ,详解的非常清晰。编译准备数据集,由于训练样本数据我们设定的是 1000ms, 所以我们需要将数据都调整成 1000ms 的音频,但实际情况中数据集中的音...原创 2020-04-14 23:00:15 · 1975 阅读 · 0 评论 -
windows+bazel+tensorflow-v1.12.0(GPU)编译生成dll与lib
目录0.最终环境1.安装 vs2015、cuda9.0、python3.5+2.安装 MSYS23.安装 Bazel4.下载tensorflow-v1.125.修改文件配置6.使用powershell进行配置与编译7.vs无法解析的外部符号与powershell编译出现无...转载 2020-04-12 23:38:37 · 904 阅读 · 0 评论 -
TensorFlow简单的音频识别,官方文档
TensorFlow简单的音频识别,官方文档 翻译 ...转载 2020-04-11 12:27:27 · 780 阅读 · 0 评论 -
YOLOV3 网络结构学习笔记
注:本文非原创,文章内容都是引用以下文章中,本文只是记录学习笔记。https://blog.youkuaiyun.com/leviopku/article/details/82660381https://blog.youkuaiyun.com/qq_41994006/article/details/88789566https://blog.youkuaiyun.com/qq_37541097/article/detai...原创 2019-10-24 00:05:39 · 26466 阅读 · 16 评论 -
HMM的学习笔记整理
隐马尔可夫模型是关于时序的概率模,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列过程,隐藏的马尔可夫链随机生成的状态序列,成为状态序列。每一个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列。原创 2020-02-15 00:42:31 · 228 阅读 · 0 评论 -
C# 语音端点检测(VAD)实现过程分析
前言:早期的方法大多是基于声学特征的提取, 在时域上, 1975年, Rabiner等人提出了基于短时能量和过零率的语音端点检测方法, 这是第一个系统而完整的语音端点检测算法。该方法共有三个门限值, 前两个是通过短时能量值来设置高、低两个门限, 进行端点位置的初判, 第三个是通过短时过零率值来设定, 并最终确定语音倾的起始点和终止点。该方法计算量小, 可以满足实时性的要求, 且在高信噪比...原创 2019-05-04 22:51:33 · 3788 阅读 · 16 评论