自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 资源 (11)
  • 问答 (1)
  • 收藏
  • 关注

原创 【ISP】HDR算法

问题:对于高动态场景,相机sensor表示范围有限,容易出现过曝问题。

2025-03-30 00:55:58 655

原创 [ISP] 人眼中的颜色

相机是如何记录颜色的,又是如何被显示器还原的?

2025-03-16 23:43:03 1036

原创 图像生成模型

从t时刻的扩散噪声中一步步恢复出真实数据分布,模型预测t时刻的噪声,用来采样t-1时刻的图像。第二项无参数,只优化第一项和第三项即可,第一项可看作第三项T=1的情况。推导:逆向过程服从高斯分布,均值和方差跟,x0,xt和扩散参数有关。添加了一个约束假设,既p(z|x)服从N(0,1)分布。的分布 ,然后通过生成器从这个分布中进行采样。的分布 ,然后通过生成器从这个分布中进行采样;假设:前向扩散过程噪声服从N~(0,1)分布。根据 t 时刻的图像预测其t时刻的噪声,使得。的分布与真实的分布相近。

2025-03-15 21:27:32 126

原创 CNN SSP, ASPP, PPM 分割任务经典尺度聚合模块

4x4, 2x2,1x1区域的maxpooling,让任意大小图像最终输出最终特征维度始终为 (16+4+1)*256。通过kernal [1,2,3,6] 池化,得到不同尺度的特征图,1x1卷积后上采样到原始尺度cat起来。[6,12,18,inf]的空洞卷积,全局pooling+上采样,之后全部cat起来。让任意大小图像最终输出的特征维度始终固定,便于接全链接层。不进行降采样的前提下,扩大感受野,融合不同尺度的特征。增强模型对多尺度上下文信息的捕获能力。

2025-03-14 23:59:40 287

原创 CNN 稠密任务经典结构

3. 卷积块可采用restNetBlock,分离卷积block等。三个网络差不多,UNet名字最直观,后续流传最广的也是Unet。1. 使用padding抱持对称性,直接进行特征cat。2. pixelShuffer作为上采样方式。

2025-03-14 23:23:27 288

原创 YOLO 各系列结构整理

预测 [x,y,w,h,confidence, x1,y2,w2,h2,confidence2,classScore*20], 非anchor形式。预测:[tx,ty,tw,th,confidence, class*20]*5 ,5种anchor。预测:N*N*[3*(1+4+80)] ,每个网格预测三个anchor box。CSPDarknet53 主干,Mish 激活,Dropblock正则化。SPP模块,FPN+PAN,使用anchor的预测形式。

2025-03-09 22:34:36 166

原创 [ISP] CIE-XYZ色彩空间

作为标准三原色波长,绘制了色彩匹配函数,如下图。选定这些波长的原因是它们能通过汞弧光谱稳定产生,且实验条件更易复现。CRE-RGB中,R存在负值计算不方便,因此采用假想的三原色进行线性变换得到CIE-XYZ。其中Y取原始三元色亮度比例:1.0000 : 4.5907 : 0.0601坐标颜色。色度图周围一圈既为颜色匹配实验中单色光的坐标(注意每个点亮度是不一样的)。既cd/m^2,相同辐射能量的光源,人眼感受到的亮度是不同的,如下所示。将R+G+B总和定为1,可在二维图像上绘制出任意RGB比例组合的颜色。

2025-03-02 16:16:05 404

原创 [ISP] AF自动对焦

主动式对焦:通过TOF,双目进行测距,然后使用tuning数据进行对焦。自动对焦方案主要有两种:主动式对焦和被动式对焦。反差对焦:通过拉风箱找到清晰度最高对焦距离。被动式对焦: 反差对焦,相位对焦。

2025-02-28 00:17:13 405

原创 [ISP] AE 自动曝光

1. 测光:点测光、中心测光、全局测光等;通过调整曝光档位使sensor曝光在合理的阈值内,根据测光模式统计区域内的统计数值。合适的曝光参数:使图像亮度(测光区域)亮度跟18度灰亮度相同,可能根据不同场景进行调整,如白加黑减。相机通过不同曝光参数(档位=快门时间 x 感光度 x 光圈大小)控制进光量来完成恰当的曝光。2. 分析:通过区域数值推算场景亮度,根据tuning数据或算法选择合适的曝光参数。3. 控制:调整相机快门时间,感光度,光圈大小完成曝光。

2025-02-28 00:03:05 311

原创 [ISP] 常见流程

6. GBC:Gree Balance Correction,同样的光照Gr、Gb像素受相邻像素影响会差生信号差异,导致出现迷宫纹,因此需要进行差异矫正。3. Linearization:sensor在对光强的记录可能是非线性的,特别是在工作范围两端。12. Global Tone Mapping:对RAW域高动态线性信号进行压缩,便于在地动态设备上进行显示,还原出人眼真实的观感。7. ABF:Adaptive Bayer Filter,自适应RAW域降噪,为后续demosaic,颜色矫正提供可靠的信号。

2025-02-27 23:43:24 378

转载 [ISP] YUV转RGB公式

YUV转RGB公式

2024-03-08 21:28:53 581

原创 WIN11+OPENCV4.8 编译及下载失败处理方法

VC或MINGW编译OPENCV 4.8.0

2023-10-25 00:04:51 670

原创 快速充电协议

目前比较流行的两个公有快充协议:PD快充协议:USB-IF(USB Implementers Forum)组织专门为USB Type-C接口推出了USB PD协议QC快充协议:高通推出的快充协议,高通处理器的手机基本都支持。

2023-06-10 15:20:37 699

原创 bmp文件格式与保存

BMP文件由三部分组成,分辨是文件头,DIM头和像素数据。

2023-06-04 15:01:07 1174

原创 【分享】看图软件

一个简易的看图软件,可以查看像素值用于图像分析。基于QT和Opencv实现,目前只实现基本功能。

2022-10-23 17:27:27 1493

原创 [c++] c++对象的初始化方式

C++的对象初始化主要分为:默认初始化值初始化零初始化直接初始化复制初始化列表初始化聚合初始化

2022-09-25 16:33:39 2176

原创 [c++] 什么是平凡类型,标准布局类型,POD类型,聚合体

这些类型的详细定义都枝词蔓语看,本文从定性的角度去认识他们。

2022-09-25 16:05:22 2133 1

原创 相机成像噪声

相机成像首先从光电二极管产生电荷,接着电荷转电压,最后电压转数字信号。下面对相机成像过程引入的噪声介绍,需要注意到下面的模型是一个较为理想的成像模型可以辅助理解,实际成像过程中电路等影响可能更为复杂实际应用可能需要具体问题具体分析。

2022-09-07 01:53:41 431

原创 什么是DFT?FT、FS、DTFT、DFS、DFT的关系

从应用角度梳理一下 FT、FS、DTFT、DFS、DFT之间的关系。

2022-08-07 16:26:25 4356

原创 【Tkinter】常用组件(二)

tkinter常用组件一览表(二)

2022-07-23 15:23:16 503

原创 理解corners_align,两种看待像素的视角

理解本质,从不同的视角理解corners_align

2022-07-22 21:19:46 302

原创 理解动态计算图,requires_grad、zero_grad

从反向传播角度理解动态计算图

2022-07-22 21:14:38 1594 1

原创 【TkInter】布局管理和事件系统

tkinter 布局管理器属性一览表

2022-07-22 01:46:52 224

原创 【TkInter】常用组件(一)

tkinter 常用空间属性和方法

2022-07-22 01:41:08 328

原创 Python脚本路径和工作目录

python获取脚本文件所在目录和文件名

2022-07-16 01:35:48 6101

原创 【AI服务器搭建】CUDA环境

深度学习开发环境部署之Cuda环境搭建

2022-06-10 23:49:19 1478

原创 【c++】对象初始化

目录1. 默认初始化2.零初始化3.值初始化4.直接初始化5.复制初始化6.聚合初始化7.列表初始化C++类型大致分为:标量: int; float; char; bool; enum; void,nullptr_t; 指针;引用复合体:数组;union;class/struct根据生存期大致可分为:静态:全局,static变量自动:局部变量,类非静态数据成员这些类型的初始化行为可以分为以下几种:1. 默认初始化语法:T obj;ne

2022-04-16 22:27:06 4706

原创 [code-python] Pillow/PIL open()函数观察

#check 52284 img=Image.open(r"C:\Users\W\Pictures\2233.jpg") #check 52812 array = np.array(img) #check 67172 img.load() # check 67168 img.close() #check #59064 del array #check 52968 del img # check 52...

2022-03-15 00:38:19 5163

原创 [分享]文件批量重命名-python

挂一个文件批量改名小工具。可以使用正则表达式匹配文件 可以灵活生成新文件名,可以使用正则表达式获取的内容,可以使用计数器介绍平时需要对大量拍摄的照片进行规范命名,特写了一个小工具,仅一个python脚本文件。完全使用python标准库实现,可跨平台不需要额外安装依赖。 可视化新旧名字预览,避免改名错误。 强大灵活的新名称生成使用方式1. 通过OpenDir选择目录加载符合之地那个统配符的文件2. 通过match pattern可以使用正则表达式进一步筛选,输入正则后

2022-03-12 16:18:45 367

原创 【C++Note】输入输出流

C++输入输出流的框架和使用笔记

2022-02-26 13:31:02 438

原创 相机中的光 —— 什么是F数,快门速度,感光度

成像参数从非专业角度的简单理解:不管是胶片相机还是数码相机都是记录自然界中的光。F数,快门速度,感光度则是对记录光数量的一个描述。F数:是焦距比上光圈孔径,同等焦距下,F挡位以1.4倍增大,对应光圈面积以二倍减少,简单认为进光量与光圈面积成正比。在不同焦距和光圈下,通过调节相同的F数可以达到近似的虚化效果。快门速度:决定对光的累计量(积分的过程)。iSO:决定对感光元件对光的敏感程度,对数码相机来说一般是控制模拟信号放大器的放大倍数,每一个挡位的放大量是2倍。.

2021-10-06 23:52:55 4237

原创 人眼中的光 —— 光强,光通量,光照度,光亮度是什么

平时接触到一些对光描述的词汇总是一头雾水,本文对这些词汇术语进行了介绍,并从非专业的角度进行理解。1. 客观存在首先,光是一种电磁波,当一个物体发光时相当于向外辐射能量。其向外辐射的光能可以用焦耳(J)表示,辐射光能的功率可以用瓦特(W)来描述。另外,光源往往以点光源的形式存在像烛光,灯泡,离我们很遥远的恒星,它们朝着四面八方发光向外扩散。我们以发光点为圆心作半径为1的一个球,球的面积为,在球的表面取面积为1的一块圆片,这块圆片对应一个锥形空间称为1立体角(sr),它可以帮我们描述光在不同...

2021-10-06 21:39:07 14498 2

原创 相机标定

1.什么是相机标定镜头对光线有折射作用,将现实中的景物投射成一幅图像。这个过程可以用一套完整的数学模型来表示。而相机的标定就是来估计这套模型的参数。对大多数普通相机,他们的数学模型就是小孔成像模型。而对广角和鱼眼镜头他们的模型可能就要复杂一些,OpenCV等采用多项式的形式去近似入射角和成像的关系。*opencv的鱼眼相机模型,采用直接近似的形式,误差比较大,并不适合一些精确的计算。目前常见的鱼眼镜头类型有下面几种,他们都有一些有意思的特性,感兴趣的小伙伴可以去了解一下。St

2020-06-13 18:32:06 633

转载 Windows Ceres 编译安装

Ceres Solver是一个C++环境下的非线性最小二乘问题的求解工具包,可用来建模并解决大型复杂的非线性最小二乘问题。这个工具包已经广泛被用于很多商业软件中。在google project里面有它的主页: http://code.google.com/p/ceres-solver/。环境Windows 10 ProVisual Studio 2015Cmake GUI 3.10....

2020-03-21 15:47:07 1963 1

原创 【OPENCV源码阅读】鱼眼镜头标定

Opencv的鱼眼镜头模型空间中的三维点,对应世界坐标X,相机坐标系下坐标为XcX_cXc​Xc=RX+TXc=RX+TXc=RX+TR是旋转对阵,对应于旋转向量om;x,y,z是XcX_cXc​的三个坐标值x=Xc1x=X_{c1}x=Xc1​y=Xc2y=X_{c2}y=Xc2​z=Xc3z=X_{c3}z=Xc3​针孔成像模型下P的坐标(a,b)(归一化平面坐标)a=x/za...

2020-03-03 19:43:40 2058

转载 Linux 中直接 I/O 机制的介绍[转]

直接 I/O 的动机在介绍直接 I/O 之前,这一小节先介绍一下为什么会出现直接 I/O 这种机制,即传统的 I/O 操作存在哪些缺点。什么是缓存 I/O (Buffered I/O)缓存 I/O 又被称作标准 I/O,大多数文件系统的默认 I/O 操作都是缓存 I/O。在 Linux 的缓存 I/O 机制中,操作系统会将 I/O 的数据缓存在文件系统的页缓存( page cache ...

2019-08-26 00:09:14 169

翻译 TeX家族整理(扫盲文)

TeX 家族带有 TeX 的词,仅仅是本文就已经提到了 TeX, LaTeX, XeLaTeX。通常中国学生面对不了解意思的一群形近单词,都会有一种「本能的恐惧」(笑~)。因此,「大神们」在为新手介绍 TeX 的时候,如果互相争论 「XXTeX 比 YYTeX 好」或者是「XXTeX 的 YYTeX 如何如何」,往往会蹦出下面这些带有 TeX 的词汇:TeX, pdfTeX, XeTeX, ...

2019-04-04 19:49:35 495

转载 对缓存的思考——提高命中率

开篇编写高效的程序并不只在于算法的精巧,还应该考虑到计算机内部的组织结构,cpu微指令的执行,缓存的组织和工作原理等。好的算法在实际中不见得有高效率,如果完全没有考虑缓存、微指令实现的话。前两篇博文局部性原理浅析 介绍了程序的局部性原理,如何写出局部性良好代码。提高程序性能、何为缓存 讨论了存储器层次结构,计算机内部的存储结构、缓存的概念,简单的介绍了缓存的工作机制。建议先...

2018-10-19 17:02:46 212

原创 C++之类型转换

C++类型转换形式很多,尤其是隐式转换的模糊很容易导致程序的各种问题。所以我参考了Cppreference简单做了一点总结:一:算数隐式转换     当表达式两个值进行运算时,首先会进行类型提升,其提升规则如下:简单点来说,当两个值进行运算时,会将两个操作数都提升为等级最高的操作数的类型。(上图从左到右等级由低到高)但是当两个操作数都为int型及其以下时,会将其全部提升为i...

2018-10-12 22:13:07 911

转载 YUV文件格式

原文:YUV图像格式的博客转:https://blog.youkuaiyun.com/armwind/article/details/52190123,文章不错特转载过来备忘一.YUV数据格式的定义和采集方式1)YUV数据格式定义     YUV分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chroma)...

2018-08-01 00:41:17 11409

bmp图像文件的简单读写库

1. 一个简单的bmp文件读写库,不支持索引颜色和压缩图像。 2. 采用minGW编译,导出为C接口没有任何依赖,可以直接使用。 3. 详细参见https://blog.youkuaiyun.com/blanklog/article/details/131032159?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22131032159%22%2C%22source%22%3A%22blanklog%22%7D

2023-06-04

EasyViewer简易看图工具

一个简易的看图软件,可以显示图像像素值大小,用于图像分析。详细http://t.csdn.cn/RVIzU

2022-10-23

python-gui 文件批量重命名

平时需要对大量拍摄的照片进行规范命名,特写了一个小工具,仅一个python脚本文件。 1.完全使用python标准库实现,可跨平台不需要额外安装依赖。 2.可视化新旧名字预览,避免改名错误。 3.强大灵活的新名称生成 可当作方便的脚本工具使用或参考-详细介绍:https://blog.youkuaiyun.com/blanklog/article/details/123444405

2022-03-13

ceres2.0及其依赖的源代码

包含ceres2.0,gflags2.2.2,glog0.5,eigen3.4,suitesparse-metis-for-windows-v1.3.1(suitesparse)的源码。亲测使用vs2019可正常编译。

2021-09-11

Opencv_and_Contrib 4.5.3 源码包含编译依赖

Opencv和contrib的源码,已经下载了编译所需要的依赖,可以直接使用cmake通过并进行编译。

2021-09-11

opencv453+vs2019编译的动态库

Opencv4.5.3 Windows下使用vs2019编译的动态库,包含contirb。未依赖CUDA及inter等硬件加速库。

2021-09-11

ceres2.0+vs2019编译的动态库

ceres2.0在windows下使用vs2019编译的动态库。包含glog、gflags、suitsparse、eigen依赖。

2021-09-11

ceresEnviroment.zip

ceres1.14在windows环境下的编译二进制文件,vs2017编译已测试可以使用。 依赖库采用动态库的方式有点散,但可以单独拿来使用,过段时间时间把依赖库改成静态编译。

2020-03-23

opencv_contrib-3.4.3(源文件)

opencv_contrib-3.4.3(源文件)从git上下载,需要自己编译,无法从github下载的可以下载使用。

2018-10-11

moedelsim 10.1c用户手册(英文版)

MoelSim用户手册对应软件版本10.1c ModelSim User's Manual - Soft Version 10.1c

2018-09-09

opencv3.4.2源码

opencv官方源码3.4.2版本。2018年七月更新,可自行编译所需要的库。

2018-07-20

IEEE Standard for Verilog 2001版和2005版

IEEE的Verilog语言标准,分别是2001版和2005版,可以根据开发工具拿来参考对比。 IEEE Standard for Verilog® Hardware Description Language

2018-07-15

saleae logic software,saleae逻辑分析软件最新版

saleae逻辑分析软件1.2.18目前最新版,官网进不去或找不到资源的可以直接拿来用。

2018-07-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除