
传统计算机视觉相关
文章平均质量分 79
传统图像处理
曾小蛙
这个作者很懒,什么都没留下…
展开
-
【webUI】gradio基础使用2——Gallery组件显示多张图片
基于python的在浏览器显示多图片显示,本文基于gradio写出最简单形式方便大家修改。后续应用:例如上传一张图片,经过处理,输出查询结果。原创 2023-10-12 14:46:59 · 10222 阅读 · 13 评论 -
【OCR理论】DBNet:任意形状文本检测模型1911.Real-time Scene Text Detection with Differentiable Binarization
检测任意形状的文本,基于实例分割的DBNet算法。DBNet将二值化进行近似,使其可导,融入训练,从而获取更准确的边界,大大降低了后处理的耗时原创 2023-09-27 18:16:59 · 599 阅读 · 0 评论 -
【论文+代码】1706.Transformer简易学习笔记
Transformer解决了RNN的不可并行化问题。最初只是与NLP任务有关目前广泛应用计算机视觉任务中原创 2023-09-06 18:47:14 · 674 阅读 · 0 评论 -
【综述+3D】基于NeRF的三维视觉2023年度进展报告(截止2023.06.10)
NeRF的核心优化手段: 端到端可微渲染(紧致-高效的三维视觉信息表达)从更本质的角度建立了二维图像与三维世界的联系原创 2023-09-04 18:22:57 · 9119 阅读 · 1 评论 -
【论文+公式ocr+代码】2308.Nougat_Neural Optical Understanding for Academic Documents (Meta AI 学术pdf识别)
识别学术文档 `PDF格式`中文字、公式, -但不包含图片 - 输入PDF , - **输出**: `.mmd `的轻量标记语言 - 用 [vscode插件](https://mathpix.com/docs/mathpix-markdown/how-to-mmd-vscode) 编辑打开) - 使用 **web框架**-**React 、NodeJS** 进行渲染和后续显示:[https://github.com/mathpix/ma原创 2023-08-31 16:50:16 · 1097 阅读 · 2 评论 -
【stable diffusion】图片批量自动打标签、标签批量修改(BLIP、wd14)用于训练SD或者LORA模型
对自己图片,自动化进行文字描述,用于训练stable-diffusion的自己的模型的大模型、训练LORA模型的数据准备原创 2023-06-12 18:11:30 · 26483 阅读 · 0 评论 -
【论文简介】DragGAN:Interactive Point-based Manipulation on the Generative Image Manifold (6月即将开源)
满足用户需求的视觉内容合成通常需要对生成对象的姿势(pose)、形状(shape)、表情(expression)和布局(layout)具备灵活且精确的可控性。现有方法通过手动标注的训练数据或先前的3D模型来实现对生成对抗网络(GANs)的可控性,但这往往缺乏灵活性、精确性和普适性。在本研究中,我们探索了一种强大但较少被探索的控制GANs的方式,即以用户交互的方式“拖动”图像中的任意点,精确地达到目标点,如图1所示。原创 2023-05-29 18:14:13 · 514 阅读 · 2 评论 -
【roLabelImg】windows下旋转框标注软件安装、使用、rolabelimg打包成exe
可标记旋转框,用来训练目标检测的最小外接矩形免编译安装,自己编译好了,开箱即用,可能有bug,可以下载博主其他资源是 打开,roLabelImg.py,删除头两行代码。标记旋转框、zxcv控制选择方向,或者。cmd端入到源代码文件夹路径。操作说明 , 快捷键。激活虚拟环境 安装依赖。(没有提示说明没问题)原创 2023-02-16 19:45:17 · 3178 阅读 · 0 评论 -
基于paddlex图像分类模型训练(一):图像分类数据集切分:文件夹转化为imagenet训练格式
在使用[paddlex GUI训练图像分类]时,内部自动对导入的分类文件夹进行细分,本文主要介绍其`图像分类数据切分源码`,或可作为其他项目储备代码:原创 2023-01-18 16:13:49 · 1419 阅读 · 0 评论 -
基于paddlex图像分类模型训练(二):训练自己的分类模型、熟悉官方demo
paddle分类,在线训练,体验原创 2023-02-03 18:30:39 · 1164 阅读 · 0 评论 -
【python拼图】遍历文件夹后,自动拼接图像成正方形图,或者指定行数显示
【代码】【python拼图】遍历文件夹后,自动拼接图像成正方形图,或者指定行数显示。原创 2022-11-30 20:22:18 · 952 阅读 · 0 评论 -
【多图像展示】仿照StyleGAN1层次化展示不同大小图片
仿照StyleGAN1层次化展示不同大小图片,以2的阶乘层次化展示图片。原创 2022-09-26 16:58:41 · 507 阅读 · 0 评论 -
【论文翻译】InsetGAN :基于多个stylegan2-ada生成器拼接的全身人像生成(2203.InsetGAN for Full-Body Image Generation)
不使用单个GAN对复杂的域进行建模,我们提出一种新的方法结合多个预先训练过的GAN,其中一个生成一个总体画布(如人体)和一组专门的GAN,或插入(inset),关注不同的部分(例如,脸、鞋子),这些部分可以无缝地插入到总体的画布。我们将这个问题建模为共同探索(jointly exploring)各自的潜在空间(respective latent spaces),这样生成的图像就可以被组合起来,通过插入来自专门的生成器(specialized generators)的部分到全局画布上(global can原创 2022-07-31 15:07:05 · 2434 阅读 · 0 评论 -
【论文简介】2204.VQGAN-CLIP(已开源):Open Domain Image Generation and Editing with Natural Language Guidance
从`开放域`(open domain)`文本提示`(text prompts)中`生成和编辑图像`是一项具有挑战性的任务,迄今为止(heretofore)一直需要昂贵的和经过专门训练的模型。- 我们演示了一种针对这两种任务的新方法,该方法能够通过使用`多模态编码器` (multimodal encoder) 来指导图像生成,在没有任何训练的情况下,从具有显著语义复杂度的文本提示中生成高视觉质量的图像- 我们在各种任务上演示了如何使用CLIP[37]来指导VQGAN[11]产生比之前更高的视觉质量输出原创 2022-05-31 12:14:29 · 3086 阅读 · 0 评论 -
【开箱即用】基于dlib的人脸关键点、对齐(face alignment)、裁剪
基于dlib的人脸关键点、对齐(face alignment)、裁剪.用于stylegan原创 2022-02-28 17:15:42 · 2918 阅读 · 0 评论 -
【人体解析】开箱即用的《self-correction-human-parsing》、获得语义标签
【人体解析】开箱即用的《self-correction-human-parsing》、获得语义标签Github | Paper | Google_colab demo (需要梯子)概述本文主要介绍 人体解析(human parse)预模型的推理使用,笔者调研了很多模型,大多配置复杂,只能对特定数据集使用,而Self-Correction-Human_Parsing 项目 能够开箱即用对单张图片进行推理使用,得到语义割图图稍微修改代码,可以同时获得RGB与灰原创 2021-12-30 10:46:38 · 4331 阅读 · 14 评论 -
【opencv】使用鼠标绘图、输出指定位置RGB/ 灰度像素值
主要参考【官方代码】 Mouse as a Paint-Brush 【官方文档】鼠标回调的事件(MouseEvent)、事件状态(MouseEventFlags)示例1:双击鼠标画圆EVENT_LBUTTONDBLCLK:双击(DBL)鼠标左键(L)出发opencv函数import numpy as npimport cv2 as cv# mouse callback functiondef draw_circle(event,x,y,flags,param): if原创 2021-11-29 20:10:25 · 4564 阅读 · 0 评论 -
【GANS】对Stylgan2的动漫头像预训练模型进行【属性编辑】
核心参考Pretrained Anime StyleGAN2 — convert to pytorch and editing images by encoder下载项目相关stylegan2-pytorch (非官方)git clone https://github.com/viuts/stylegan2_pytorch.git动漫头像(anime-face)模型下载2020-01-11-skylion-stylegan2-animeportraits-networksnapshot-024原创 2021-09-30 14:59:25 · 2677 阅读 · 9 评论 -
【API调用】人脸检测+人脸属性(旷视 / 百度)
文章目录1 简介2 旷视 face++2.1 注册[注册 API Key](https://console.faceplusplus.com.cn/app/apikey/list)2.2 调用API(以人脸检测为例)代码将结果转化为json,可修改为2.3 API返回结果keys完整结果2.3 异常3. 百度创建应用获取access_token完整的测试程序1 简介人脸检测,人脸属性编辑,2 旷视 face++官网web-demo在线演示2.1 注册注册 API Key登录旷视人工智能开原创 2021-08-31 11:51:18 · 5169 阅读 · 0 评论 -
【GANs】图像编辑与生成的应用调研
调研课题推荐按照一定风格创造新的角色、图标、头像按照聊天内容生成符合语义的图片(动作、表情、语音)同一个美术角色可以AI换姿势和服饰备选应用方向外网18个gan的应用方向图像编辑3D对象生成人物姿态图像生成人物卡通图像的转换综述调研1906.Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy生成对抗网络在计算机视觉上的综述和分类2001.A Review on Genera原创 2021-06-30 19:23:57 · 567 阅读 · 0 评论 -
【图像搜索】基于pytorch官方预训练模型的简易相似图片搜索
简易的相似图像搜索算法图片数据库查询结果本文主要方法流程预训练模型 + 单张图像的特征 ( 逐个保存,形成数据库)+ 特征压缩(选做)获取查询图像的特征向量将查询的特征向量与数据库保存的所有特征进行余弦距离计算返回结果实际编写自定义图片数据集读取代码pytorch SWAV预训练模型 (paper Unsupervised Learning of Visual Features by Contrasting Cluster Assignments.)抽原创 2021-05-31 19:59:15 · 6949 阅读 · 2 评论 -
【求职】2021年成都中小公司图像算法/计算机视觉/深度学习岗位面试心得
一、简介主要内容本文面试心得总结于笔者2021年3月~4月一个半月时间的成都地区计算机视觉岗位的面试。 90%以上面试的公司都是远程面试,所以笔试相对较少公司水平50~1000人的中小公司,几乎不涉及初创公司和国企、研究所、一线互联网公司。 行业领域主要集中在 游戏、缺陷检测、智能安防等邻域二、高频问题机器学习svm用过吗?什么原理? 逻辑回归是什么,算法流程。 主成分分析法,算法流程? 牛顿法的迭代公式 JS散度公式是什么? 交叉熵、极大使然、有什么区别?深度.原创 2021-04-30 09:18:37 · 535 阅读 · 1 评论 -
【实例分割】基于PaddleDetection的MaskRCNN对自己数据集进行检测
简介最近项目需要用到实例分割,起初以为飞浆将模型放在PaddleSeg里,其实归类到目标检测的工具包**PaddleDetection**。本文主要流程:labelme标记的如何自己数据、以及配置PaddleDetection安装与测试labelme实例分割数据转化PaddleDetection训练所支持的coco格式修改配置文件开始训练第一步:labelme标记分割数据集官方源: https://github.com/wkentaro/labelme国内源下载与安装:https:/原创 2021-03-25 21:36:49 · 3973 阅读 · 0 评论 -
【Gabor滤波器】提取图像纹理(Python、C++两种实现)
主要参考:(后续链接重复)分析opencv实现的gabor + 不同参数的gabor核(图):https://blog.youkuaiyun.com/lhanchao/article/details/55006663 分析wiki百科的gabor实现:https://zhuanlan.zhihu.com/p/33311267 原理、opencv+c++实现:https://blog.youkuaiyun.com/ibelievesunshine/article/details/105113458 本文代码下载:https原创 2021-02-26 20:47:20 · 11302 阅读 · 0 评论 -
【AI模型部署】基于flask的pytorch简单分类模型部署
【本博客代码】https://gitee.com/zengxy2020/csdn/tree/master/flask 【官方教程】https://pytorch.org/tutorials/intermediate/flask_rest_api_tutorial.html 【官方代码】https://github.com/avinassh/pytorch-flask-api(本博客基于此代码有改动) 【flask文档】https://flask.palletsprojects.com/en/1.1.x原创 2020-10-24 21:22:36 · 4296 阅读 · 4 评论 -
【远程服务器持续运行】ssh远程主机后,使用screen不间断执行程序
主要参考: ssh远程主机后,使用screen程序后台运行:https://blog.youkuaiyun.com/xygl2009/article/details/77671596?utm_source=blogxgwz5 screen 状态为Attached ,无法进入:https://blog.youkuaiyun.com/gdali/article/details/72799581 screen更详细解释 简介本地通过SSH远程登录Linux服务器,运行程序,若不使用辅助方法,在此期间不原创 2020-10-10 12:00:37 · 540 阅读 · 0 评论 -
【训练数据可视化】从多个json文件提取出分散保存参数值并绘图可视化
主要参考获取json的所有keys与键值 matplotlib pyplot 画图基础教程:https://blog.youkuaiyun.com/eefresher/article/details/90022648简介训练过程某些参数保存在多个json文件中,本博文主要介绍了如何将这些数据可视化化显示。图1 训练过程中保存的在json文件中的参数 图2 json文件中的参数图3 多个json文件保存...原创 2020-09-28 21:32:28 · 877 阅读 · 0 评论 -
【生成对抗网络】GANs原理解析(一):Vanilla_GANs(2014年首次提出的原始GANs)
【原论文】(2014年)Generative Adversarial Networkshttps://arxiv.org/abs/1406.2661简介生成对抗网络(GANs),是指采用特定结构和训练思想的一类模型结构,它可以很简单,仅由几层感知机实现,也可以很复杂,使用深度神经网络来实现。最原始的GANs是2014年提出的,又叫Vanilla GANs。这种结构主要包含生成模型和判别模型,生成模型的任务是去生成某个特定分布的数据,例如合成和真实图片接近的图片,它生成的数据(图片),我们称为..原创 2020-08-31 20:31:17 · 1789 阅读 · 0 评论 -
【opencv-python】官方教程整理(一):GUI使用:画线、圆、矩形,滑动条鼠标交互等
简介:本博文主要基于opencv官网教程的第一部分 OpenCV-Python Tutorials:Gui Features in OpenCV 进行整理的,其中 OpenCV-Python Tutorials的位置是在online documentation中,选择Doxygen HTML对应opencv版本后出现的。。。不在官网首页的Tutorials,那里面只是教程的一部分,面向C++的。点击进入online documentation(https://docs.opencv.org/)..原创 2020-07-31 20:38:38 · 1584 阅读 · 1 评论 -
【opencv】图片放大缩小到指定大小或按指定比例f放大缩小(resize函数)c++
简介本文实验是在Ubuntu下基于opencv3.4.6的resize()函数进行图片的大小变换的,主要有两种方式,一种是指定的变换后的图像大小,一种是给出图像放大缩小的比例,lena原图大小为 【512x512】分别变换为【456x123】,和【512*0.5,512*3】,结果:【此为原图】【结果图比较畸形,就不做显示了--】C++实现代码之前项目比较急的时候,在设定图像变换大小的时候,总是将Size(x,y)漏写成(x,y),一直报错,以及不理解Size(空)的意义,通过输出,发.原创 2020-06-30 20:39:40 · 7526 阅读 · 0 评论 -
[语义分割]训练deeplabv3(一):建立自己的数据集
[deeplabv3+]:https://github.com/tensorflow/models/tree/master/research/deeplab[labelme]:https://github.com/wkentaro/labelme简介本博客主要介绍了,deeplabv3+训练前的自己数据集准备工作: 即将用labelme标记的自己的语义分割数据集转化为deeplabv3...原创 2020-04-29 21:46:18 · 1559 阅读 · 0 评论 -
【批量读取文件夹中图片路径】使用c++ 中dirent.h 或者使用opencv3中的cv::glob
源码上一层文件夹test中存储的图片使用两种不同方法读取的结果总的代码#include <opencv2/opencv.hpp>// #include <contrib.hpp>#include <vector>#include <iostream>#include <fstream>#inc...原创 2020-01-08 21:45:41 · 1038 阅读 · 0 评论 -
Ubuntu16.04 + Sublime 查看opencv3.4 函数API及源码的变通方法
缘起最近因项目需要在Linux Ubuntu系统进行图像处理开发,相较于在Windows下利用Visual Studio 201x 开发有很多不习惯:由于不会配置, opencv的自带函数无法直接跳转查看函数的API接口和源码实现,影响开发效率 写好程序后,不像windows使用VS直接编译运行,需要自己写代码进行编译.Opencv(C++)函数直接跳转至定义处笔者使用...原创 2019-11-29 21:59:24 · 435 阅读 · 0 评论 -
【MTK Camera】简介与概述
Camera 硬件介绍1.1 图像传感器的类型(Image Sensor)a) YUV sensor输出数据(data)格式为YUV,即图像的明亮度、色度、浓度。(缩写与英文单词未对应) 图像的效果处理使用Sensor内部的ISP, BB端接收YUV格式的data后只进行格式的转换, 效果方面不进行处理,由于Sensor内部的ISP处理能力有限,且YUV Sensor的数据量比...转载 2019-08-31 13:39:41 · 6864 阅读 · 1 评论 -
【OpenCV】 2.4.13-编程过程遇到问题记录
Q1:配置完的opencv,用测试程序运行,头文件成功引用,但还是出现 “Mat”:未声明标识符 ? Solution1: 未使用命名空间,"using namespace cv ;"或者“cv::Mat”using namespace cv;cv::MatQ2:使用system("pause"),imshow()显示图片时,程序奔溃? Solution2...原创 2018-07-13 11:09:38 · 265 阅读 · 0 评论 -
图片感兴趣区域ROI获取——鼠标选择矩阵区域+不规则多边形区域(anoconda3.4+spyder+python3.5+opencv3.4)
一.python+OpenCV 鼠标交互图片切割矩形区域【转载】https://www.jianshu.com/p/5f7df3d8b237# -*- coding: utf-8 -*-"""Created on Mon Jun 25 22:22:42 2018"""#-----------------------------------------------------...原创 2018-06-25 22:56:00 · 6125 阅读 · 0 评论 -
【目标检测】Non-Maximum-Suppression(非极大值抑制):来自pyimagesearch 2014年的教程
python版本(来自pyimagesearch)Non-Maximum Suppression for Object Detection in Python【原博文链接】https://www.pyimagesearch.com/2014/11/17/non-maximum-suppression-object-detection-python/【代码地址下载】:https://...转载 2019-01-21 18:29:46 · 342 阅读 · 0 评论 -
【OpenCV Java】opencv官方java例程演示(Windows下)
0下载与安装 (Windows下)https://opencv.org/:选择喜欢的版本安装,opencv3.4以后支持深度学习API1 环境搭建 OpenCV Java with Eclipse:https://docs.opencv.org/trunk/d1/d0a/tutorial_java_eclipse.html问题1:搭建opencv4.0环境失败:...原创 2019-02-27 11:31:46 · 19713 阅读 · 1 评论 -
【目标跟踪】pyimagesearch目标跟踪、中心点匹配示例程序汇总(python-opencv-dlib-dnn)
Simple object tracking with OpenCV(centroid tracking with OpenCV)【原文链接】https://www.pyimagesearch.com/2018/07/23/simple-object-tracking-with-opencv/【代码下载】https://pan.baidu.com/s/1VVVb2BY-NyTWavO4...原创 2019-02-27 09:39:00 · 3902 阅读 · 0 评论 -
【Python-opencv3.4】视频基本操作(帧率,总视频帧数、从第N帧开始播放、播放进度显示、按键控制视频)
一、视频基本操作:1.读取视频帧率、分辨率、读取视频总帧数、起始播放帧数 2.使用键盘控制视频 3.显示视频播放进度 二、基本操作对应代码【完整代码】提取码:0vvb1.读取视频帧率、分辨率、读取视频总帧数#——————————————————————————————#————————添加自己的视频播放路径———————————video_path="F:/Ze...原创 2019-05-30 22:32:54 · 15006 阅读 · 6 评论