blanklog-优快云博客

原创数据集下载

微软COCO数据集是广泛使用的目标检测基准数据库，包含20万张图像和80个类别的50万个目标标注。数据集分为train2017、val2017和test2017三部分，提供图像和标注文件的下载链接，每个图像平均包含7.2个标注目标。该数据集已成为目标检测研究的重要资源。

2025-08-28 15:36:19 352

原创【ISP】HDR算法

问题：对于高动态场景，相机sensor表示范围有限，容易出现过曝问题。

2025-03-30 00:55:58 1220

原创 [ISP] 人眼中的颜色

相机是如何记录颜色的，又是如何被显示器还原的？

2025-03-16 23:43:03 1145

从t时刻的扩散噪声中一步步恢复出真实数据分布，模型预测t时刻的噪声，用来采样t-1时刻的图像。第二项无参数，只优化第一项和第三项即可，第一项可看作第三项T=1的情况。推导：逆向过程服从高斯分布，均值和方差跟,x0,xt和扩散参数有关。添加了一个约束假设，既p(z|x)服从N(0,1)分布。的分布，然后通过生成器从这个分布中进行采样。的分布，然后通过生成器从这个分布中进行采样；假设：前向扩散过程噪声服从N~(0,1)分布。根据 t 时刻的图像预测其t时刻的噪声，使得。的分布与真实的分布相近。

2025-03-15 21:27:32 220

原创 CNN SSP, ASPP, PPM 分割任务经典尺度聚合模块

4x4, 2x2,1x1区域的maxpooling，让任意大小图像最终输出最终特征维度始终为（16+4+1)*256。通过kernal [1,2,3,6] 池化，得到不同尺度的特征图，1x1卷积后上采样到原始尺度cat起来。[6,12,18，inf]的空洞卷积，全局pooling+上采样，之后全部cat起来。让任意大小图像最终输出的特征维度始终固定，便于接全链接层。不进行降采样的前提下，扩大感受野，融合不同尺度的特征。增强模型对多尺度上下文信息的捕获能力。

2025-03-14 23:59:40 449

原创 CNN 稠密任务经典结构

3. 卷积块可采用restNetBlock，分离卷积block等。三个网络差不多，UNet名字最直观，后续流传最广的也是Unet。1. 使用padding抱持对称性，直接进行特征cat。2. pixelShuffer作为上采样方式。

2025-03-14 23:23:27 329

原创 YOLO 各系列结构整理

预测 [x,y,w,h,confidence, x1,y2,w2,h2,confidence2,classScore*20], 非anchor形式。预测：[tx,ty,tw,th,confidence, class*20]*5 ,5种anchor。预测：N*N*[3*(1+4+80)] ，每个网格预测三个anchor box。CSPDarknet53 主干，Mish 激活，Dropblock正则化。SPP模块，FPN+PAN，使用anchor的预测形式。

2025-03-09 22:34:36 840

原创 [ISP] CIE-XYZ色彩空间

作为标准三原色波长，绘制了色彩匹配函数，如下图。选定这些波长的原因是它们能通过汞弧光谱稳定产生，且实验条件更易复现。CRE-RGB中，R存在负值计算不方便，因此采用假想的三原色进行线性变换得到CIE-XYZ。其中Y取原始三元色亮度比例：1.0000 : 4.5907 : 0.0601坐标颜色。色度图周围一圈既为颜色匹配实验中单色光的坐标（注意每个点亮度是不一样的）。既cd/m^2，相同辐射能量的光源，人眼感受到的亮度是不同的，如下所示。将R+G+B总和定为1，可在二维图像上绘制出任意RGB比例组合的颜色。

2025-03-02 16:16:05 1145

原创 [ISP] AF自动对焦

主动式对焦：通过TOF，双目进行测距，然后使用tuning数据进行对焦。自动对焦方案主要有两种：主动式对焦和被动式对焦。反差对焦：通过拉风箱找到清晰度最高对焦距离。被动式对焦: 反差对焦，相位对焦。

2025-02-28 00:17:13 717

原创 [ISP] AE 自动曝光

1. 测光：点测光、中心测光、全局测光等；通过调整曝光档位使sensor曝光在合理的阈值内，根据测光模式统计区域内的统计数值。合适的曝光参数：使图像亮度（测光区域）亮度跟18度灰亮度相同，可能根据不同场景进行调整，如白加黑减。相机通过不同曝光参数（档位=快门时间 x 感光度 x 光圈大小）控制进光量来完成恰当的曝光。2. 分析：通过区域数值推算场景亮度，根据tuning数据或算法选择合适的曝光参数。3. 控制：调整相机快门时间，感光度，光圈大小完成曝光。

2025-02-28 00:03:05 582

原创 [ISP] 常见流程

6. GBC：Gree Balance Correction，同样的光照Gr、Gb像素受相邻像素影响会差生信号差异，导致出现迷宫纹，因此需要进行差异矫正。3. Linearization：sensor在对光强的记录可能是非线性的，特别是在工作范围两端。12. Global Tone Mapping：对RAW域高动态线性信号进行压缩，便于在地动态设备上进行显示，还原出人眼真实的观感。7. ABF：Adaptive Bayer Filter，自适应RAW域降噪，为后续demosaic，颜色矫正提供可靠的信号。

2025-02-27 23:43:24 523

转载 [ISP] YUV转RGB公式

YUV转RGB公式

2024-03-08 21:28:53 998

原创 WIN11+OPENCV4.8 编译及下载失败处理方法

VC或MINGW编译OPENCV 4.8.0

2023-10-25 00:04:51 840

原创快速充电协议

目前比较流行的两个公有快充协议：PD快充协议：USB-IF(USB Implementers Forum)组织专门为USB Type-C接口推出了USB PD协议QC快充协议：高通推出的快充协议，高通处理器的手机基本都支持。

2023-06-10 15:20:37 1184

原创 bmp文件格式与保存

BMP文件由三部分组成，分辨是文件头，DIM头和像素数据。

2023-06-04 15:01:07 1366

原创【分享】看图软件

一个简易的看图软件，可以查看像素值用于图像分析。基于QT和Opencv实现，目前只实现基本功能。

2022-10-23 17:27:27 1562

原创 [c++] c++对象的初始化方式

C++的对象初始化主要分为:默认初始化值初始化零初始化直接初始化复制初始化列表初始化聚合初始化

2022-09-25 16:33:39 2263

原创 [c++] 什么是平凡类型，标准布局类型，POD类型，聚合体

这些类型的详细定义都枝词蔓语看，本文从定性的角度去认识他们。

2022-09-25 16:05:22 2342 1

原创相机成像噪声

相机成像首先从光电二极管产生电荷，接着电荷转电压，最后电压转数字信号。下面对相机成像过程引入的噪声介绍，需要注意到下面的模型是一个较为理想的成像模型可以辅助理解，实际成像过程中电路等影响可能更为复杂实际应用可能需要具体问题具体分析。

2022-09-07 01:53:41 620

原创什么是DFT？FT、FS、DTFT、DFS、DFT的关系

从应用角度梳理一下 FT、FS、DTFT、DFS、DFT之间的关系。

2022-08-07 16:26:25 4581

原创【Tkinter】常用组件（二）

tkinter常用组件一览表(二)

2022-07-23 15:23:16 538

原创理解corners_align，两种看待像素的视角

理解本质，从不同的视角理解corners_align

2022-07-22 21:19:46 400

原创理解动态计算图，requires_grad、zero_grad

从反向传播角度理解动态计算图

2022-07-22 21:14:38 1762 1

原创【TkInter】布局管理和事件系统

tkinter 布局管理器属性一览表

2022-07-22 01:46:52 282

原创【TkInter】常用组件(一)

tkinter 常用空间属性和方法

2022-07-22 01:41:08 377

原创 Python脚本路径和工作目录

python获取脚本文件所在目录和文件名

2022-07-16 01:35:48 6581

原创【AI服务器搭建】CUDA环境

深度学习开发环境部署之Cuda环境搭建

2022-06-10 23:49:19 1569

原创【c++】对象初始化

目录1. 默认初始化2.零初始化3.值初始化4.直接初始化5.复制初始化6.聚合初始化7.列表初始化C++类型大致分为：标量: int; float; char; bool; enum; void,nullptr_t; 指针；引用复合体：数组；union；class/struct根据生存期大致可分为：静态：全局，static变量自动：局部变量，类非静态数据成员这些类型的初始化行为可以分为以下几种：1. 默认初始化语法：T obj;ne

2022-04-16 22:27:06 4786

原创 [code-python] Pillow/PIL open()函数观察

#check 52284 img=Image.open(r"C:\Users\W\Pictures\2233.jpg") #check 52812 array = np.array(img) #check 67172 img.load() # check 67168 img.close() #check #59064 del array #check 52968 del img # check 52...

2022-03-15 00:38:19 5240

原创 [分享]文件批量重命名-python

挂一个文件批量改名小工具。可以使用正则表达式匹配文件可以灵活生成新文件名，可以使用正则表达式获取的内容，可以使用计数器介绍平时需要对大量拍摄的照片进行规范命名，特写了一个小工具，仅一个python脚本文件。完全使用python标准库实现，可跨平台不需要额外安装依赖。可视化新旧名字预览，避免改名错误。强大灵活的新名称生成使用方式1. 通过OpenDir选择目录加载符合之地那个统配符的文件2. 通过match pattern可以使用正则表达式进一步筛选，输入正则后

2022-03-12 16:18:45 409

原创【C++Note】输入输出流

C++输入输出流的框架和使用笔记

2022-02-26 13:31:02 464

原创相机中的光 —— 什么是F数，快门速度，感光度

成像参数从非专业角度的简单理解：不管是胶片相机还是数码相机都是记录自然界中的光。F数，快门速度，感光度则是对记录光数量的一个描述。F数：是焦距比上光圈孔径，同等焦距下，F挡位以1.4倍增大，对应光圈面积以二倍减少，简单认为进光量与光圈面积成正比。在不同焦距和光圈下，通过调节相同的F数可以达到近似的虚化效果。快门速度：决定对光的累计量(积分的过程)。iSO：决定对感光元件对光的敏感程度，对数码相机来说一般是控制模拟信号放大器的放大倍数，每一个挡位的放大量是2倍。.

2021-10-06 23:52:55 5062

原创人眼中的光 —— 光强，光通量，光照度，光亮度是什么

平时接触到一些对光描述的词汇总是一头雾水，本文对这些词汇术语进行了介绍，并从非专业的角度进行理解。1. 客观存在首先，光是一种电磁波，当一个物体发光时相当于向外辐射能量。其向外辐射的光能可以用焦耳(J)表示，辐射光能的功率可以用瓦特（W）来描述。另外，光源往往以点光源的形式存在像烛光，灯泡，离我们很遥远的恒星，它们朝着四面八方发光向外扩散。我们以发光点为圆心作半径为1的一个球，球的面积为，在球的表面取面积为1的一块圆片，这块圆片对应一个锥形空间称为1立体角(sr)，它可以帮我们描述光在不同...

2021-10-06 21:39:07 16911 2

原创相机标定

1.什么是相机标定镜头对光线有折射作用，将现实中的景物投射成一幅图像。这个过程可以用一套完整的数学模型来表示。而相机的标定就是来估计这套模型的参数。对大多数普通相机，他们的数学模型就是小孔成像模型。而对广角和鱼眼镜头他们的模型可能就要复杂一些，OpenCV等采用多项式的形式去近似入射角和成像的关系。*opencv的鱼眼相机模型，采用直接近似的形式，误差比较大，并不适合一些精确的计算。目前常见的鱼眼镜头类型有下面几种，他们都有一些有意思的特性，感兴趣的小伙伴可以去了解一下。St

2020-06-13 18:32:06 741

转载 Windows Ceres 编译安装

Ceres Solver是一个C++环境下的非线性最小二乘问题的求解工具包，可用来建模并解决大型复杂的非线性最小二乘问题。这个工具包已经广泛被用于很多商业软件中。在google project里面有它的主页： http://code.google.com/p/ceres-solver/。环境Windows 10 ProVisual Studio 2015Cmake GUI 3.10....

2020-03-21 15:47:07 2110 1

原创【OPENCV源码阅读】鱼眼镜头标定

Opencv的鱼眼镜头模型空间中的三维点，对应世界坐标X，相机坐标系下坐标为XcX_cXcXc=RX+TXc=RX+TXc=RX+TR是旋转对阵，对应于旋转向量om；x，y，z是XcX_cXc的三个坐标值x=Xc1x=X_{c1}x=Xc1y=Xc2y=X_{c2}y=Xc2z=Xc3z=X_{c3}z=Xc3针孔成像模型下P的坐标(a,b)（归一化平面坐标）a=x/za...

2020-03-03 19:43:40 2223

转载 Linux 中直接 I/O 机制的介绍[转]

直接 I/O 的动机在介绍直接 I/O 之前，这一小节先介绍一下为什么会出现直接 I/O 这种机制，即传统的 I/O 操作存在哪些缺点。什么是缓存 I/O (Buffered I/O)缓存 I/O 又被称作标准 I/O，大多数文件系统的默认 I/O 操作都是缓存 I/O。在 Linux 的缓存 I/O 机制中，操作系统会将 I/O 的数据缓存在文件系统的页缓存（ page cache ...

2019-08-26 00:09:14 198

翻译 TeX家族整理(扫盲文)

TeX 家族带有 TeX 的词，仅仅是本文就已经提到了 TeX, LaTeX, XeLaTeX。通常中国学生面对不了解意思的一群形近单词，都会有一种「本能的恐惧」（笑~）。因此，「大神们」在为新手介绍 TeX 的时候，如果互相争论「XXTeX 比 YYTeX 好」或者是「XXTeX 的 YYTeX 如何如何」，往往会蹦出下面这些带有 TeX 的词汇：TeX, pdfTeX, XeTeX, ...

2019-04-04 19:49:35 557

转载对缓存的思考——提高命中率

开篇编写高效的程序并不只在于算法的精巧，还应该考虑到计算机内部的组织结构，cpu微指令的执行，缓存的组织和工作原理等。好的算法在实际中不见得有高效率，如果完全没有考虑缓存、微指令实现的话。前两篇博文局部性原理浅析介绍了程序的局部性原理，如何写出局部性良好代码。提高程序性能、何为缓存讨论了存储器层次结构，计算机内部的存储结构、缓存的概念，简单的介绍了缓存的工作机制。建议先...

2018-10-19 17:02:46 238

原创 C++之类型转换

C++类型转换形式很多，尤其是隐式转换的模糊很容易导致程序的各种问题。所以我参考了Cppreference简单做了一点总结：一：算数隐式转换当表达式两个值进行运算时，首先会进行类型提升，其提升规则如下：简单点来说，当两个值进行运算时，会将两个操作数都提升为等级最高的操作数的类型。（上图从左到右等级由低到高）但是当两个操作数都为int型及其以下时，会将其全部提升为i...

2018-10-12 22:13:07 969

bmp图像文件的简单读写库

1. 一个简单的bmp文件读写库，不支持索引颜色和压缩图像。 2. 采用minGW编译，导出为C接口没有任何依赖，可以直接使用。 3. 详细参见https://blog.youkuaiyun.com/blanklog/article/details/131032159?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22131032159%22%2C%22source%22%3A%22blanklog%22%7D

2023-06-04

TA关注的人

bmp图像文件的简单读写库

EasyViewer简易看图工具

python-gui 文件批量重命名

ceres2.0+vs2019编译的动态库

saleae logic software，saleae逻辑分析软件最新版

ceres2.0及其依赖的源代码

Opencv_and_Contrib 4.5.3 源码包含编译依赖

IEEE Standard for Verilog 2001版和2005版

opencv453+vs2019编译的动态库

opencv3.4.2源码

opencv_contrib-3.4.3（源文件）

ceresEnviroment.zip

moedelsim 10.1c用户手册（英文版）

linux第三方库不区分debug和release版本么？