- 博客(47)
- 资源 (11)
- 问答 (1)
- 收藏
- 关注
原创 图像生成模型
从t时刻的扩散噪声中一步步恢复出真实数据分布,模型预测t时刻的噪声,用来采样t-1时刻的图像。第二项无参数,只优化第一项和第三项即可,第一项可看作第三项T=1的情况。推导:逆向过程服从高斯分布,均值和方差跟,x0,xt和扩散参数有关。添加了一个约束假设,既p(z|x)服从N(0,1)分布。的分布 ,然后通过生成器从这个分布中进行采样。的分布 ,然后通过生成器从这个分布中进行采样;假设:前向扩散过程噪声服从N~(0,1)分布。根据 t 时刻的图像预测其t时刻的噪声,使得。的分布与真实的分布相近。
2025-03-15 21:27:32
126
原创 CNN SSP, ASPP, PPM 分割任务经典尺度聚合模块
4x4, 2x2,1x1区域的maxpooling,让任意大小图像最终输出最终特征维度始终为 (16+4+1)*256。通过kernal [1,2,3,6] 池化,得到不同尺度的特征图,1x1卷积后上采样到原始尺度cat起来。[6,12,18,inf]的空洞卷积,全局pooling+上采样,之后全部cat起来。让任意大小图像最终输出的特征维度始终固定,便于接全链接层。不进行降采样的前提下,扩大感受野,融合不同尺度的特征。增强模型对多尺度上下文信息的捕获能力。
2025-03-14 23:59:40
287
原创 CNN 稠密任务经典结构
3. 卷积块可采用restNetBlock,分离卷积block等。三个网络差不多,UNet名字最直观,后续流传最广的也是Unet。1. 使用padding抱持对称性,直接进行特征cat。2. pixelShuffer作为上采样方式。
2025-03-14 23:23:27
288
原创 YOLO 各系列结构整理
预测 [x,y,w,h,confidence, x1,y2,w2,h2,confidence2,classScore*20], 非anchor形式。预测:[tx,ty,tw,th,confidence, class*20]*5 ,5种anchor。预测:N*N*[3*(1+4+80)] ,每个网格预测三个anchor box。CSPDarknet53 主干,Mish 激活,Dropblock正则化。SPP模块,FPN+PAN,使用anchor的预测形式。
2025-03-09 22:34:36
166
原创 [ISP] CIE-XYZ色彩空间
作为标准三原色波长,绘制了色彩匹配函数,如下图。选定这些波长的原因是它们能通过汞弧光谱稳定产生,且实验条件更易复现。CRE-RGB中,R存在负值计算不方便,因此采用假想的三原色进行线性变换得到CIE-XYZ。其中Y取原始三元色亮度比例:1.0000 : 4.5907 : 0.0601坐标颜色。色度图周围一圈既为颜色匹配实验中单色光的坐标(注意每个点亮度是不一样的)。既cd/m^2,相同辐射能量的光源,人眼感受到的亮度是不同的,如下所示。将R+G+B总和定为1,可在二维图像上绘制出任意RGB比例组合的颜色。
2025-03-02 16:16:05
404
原创 [ISP] AF自动对焦
主动式对焦:通过TOF,双目进行测距,然后使用tuning数据进行对焦。自动对焦方案主要有两种:主动式对焦和被动式对焦。反差对焦:通过拉风箱找到清晰度最高对焦距离。被动式对焦: 反差对焦,相位对焦。
2025-02-28 00:17:13
405
原创 [ISP] AE 自动曝光
1. 测光:点测光、中心测光、全局测光等;通过调整曝光档位使sensor曝光在合理的阈值内,根据测光模式统计区域内的统计数值。合适的曝光参数:使图像亮度(测光区域)亮度跟18度灰亮度相同,可能根据不同场景进行调整,如白加黑减。相机通过不同曝光参数(档位=快门时间 x 感光度 x 光圈大小)控制进光量来完成恰当的曝光。2. 分析:通过区域数值推算场景亮度,根据tuning数据或算法选择合适的曝光参数。3. 控制:调整相机快门时间,感光度,光圈大小完成曝光。
2025-02-28 00:03:05
311
原创 [ISP] 常见流程
6. GBC:Gree Balance Correction,同样的光照Gr、Gb像素受相邻像素影响会差生信号差异,导致出现迷宫纹,因此需要进行差异矫正。3. Linearization:sensor在对光强的记录可能是非线性的,特别是在工作范围两端。12. Global Tone Mapping:对RAW域高动态线性信号进行压缩,便于在地动态设备上进行显示,还原出人眼真实的观感。7. ABF:Adaptive Bayer Filter,自适应RAW域降噪,为后续demosaic,颜色矫正提供可靠的信号。
2025-02-27 23:43:24
378
原创 快速充电协议
目前比较流行的两个公有快充协议:PD快充协议:USB-IF(USB Implementers Forum)组织专门为USB Type-C接口推出了USB PD协议QC快充协议:高通推出的快充协议,高通处理器的手机基本都支持。
2023-06-10 15:20:37
699
原创 相机成像噪声
相机成像首先从光电二极管产生电荷,接着电荷转电压,最后电压转数字信号。下面对相机成像过程引入的噪声介绍,需要注意到下面的模型是一个较为理想的成像模型可以辅助理解,实际成像过程中电路等影响可能更为复杂实际应用可能需要具体问题具体分析。
2022-09-07 01:53:41
431
原创 【c++】对象初始化
目录1. 默认初始化2.零初始化3.值初始化4.直接初始化5.复制初始化6.聚合初始化7.列表初始化C++类型大致分为:标量: int; float; char; bool; enum; void,nullptr_t; 指针;引用复合体:数组;union;class/struct根据生存期大致可分为:静态:全局,static变量自动:局部变量,类非静态数据成员这些类型的初始化行为可以分为以下几种:1. 默认初始化语法:T obj;ne
2022-04-16 22:27:06
4706
原创 [code-python] Pillow/PIL open()函数观察
#check 52284 img=Image.open(r"C:\Users\W\Pictures\2233.jpg") #check 52812 array = np.array(img) #check 67172 img.load() # check 67168 img.close() #check #59064 del array #check 52968 del img # check 52...
2022-03-15 00:38:19
5163
原创 [分享]文件批量重命名-python
挂一个文件批量改名小工具。可以使用正则表达式匹配文件 可以灵活生成新文件名,可以使用正则表达式获取的内容,可以使用计数器介绍平时需要对大量拍摄的照片进行规范命名,特写了一个小工具,仅一个python脚本文件。完全使用python标准库实现,可跨平台不需要额外安装依赖。 可视化新旧名字预览,避免改名错误。 强大灵活的新名称生成使用方式1. 通过OpenDir选择目录加载符合之地那个统配符的文件2. 通过match pattern可以使用正则表达式进一步筛选,输入正则后
2022-03-12 16:18:45
367
原创 相机中的光 —— 什么是F数,快门速度,感光度
成像参数从非专业角度的简单理解:不管是胶片相机还是数码相机都是记录自然界中的光。F数,快门速度,感光度则是对记录光数量的一个描述。F数:是焦距比上光圈孔径,同等焦距下,F挡位以1.4倍增大,对应光圈面积以二倍减少,简单认为进光量与光圈面积成正比。在不同焦距和光圈下,通过调节相同的F数可以达到近似的虚化效果。快门速度:决定对光的累计量(积分的过程)。iSO:决定对感光元件对光的敏感程度,对数码相机来说一般是控制模拟信号放大器的放大倍数,每一个挡位的放大量是2倍。.
2021-10-06 23:52:55
4237
原创 人眼中的光 —— 光强,光通量,光照度,光亮度是什么
平时接触到一些对光描述的词汇总是一头雾水,本文对这些词汇术语进行了介绍,并从非专业的角度进行理解。1. 客观存在首先,光是一种电磁波,当一个物体发光时相当于向外辐射能量。其向外辐射的光能可以用焦耳(J)表示,辐射光能的功率可以用瓦特(W)来描述。另外,光源往往以点光源的形式存在像烛光,灯泡,离我们很遥远的恒星,它们朝着四面八方发光向外扩散。我们以发光点为圆心作半径为1的一个球,球的面积为,在球的表面取面积为1的一块圆片,这块圆片对应一个锥形空间称为1立体角(sr),它可以帮我们描述光在不同...
2021-10-06 21:39:07
14498
2
原创 相机标定
1.什么是相机标定镜头对光线有折射作用,将现实中的景物投射成一幅图像。这个过程可以用一套完整的数学模型来表示。而相机的标定就是来估计这套模型的参数。对大多数普通相机,他们的数学模型就是小孔成像模型。而对广角和鱼眼镜头他们的模型可能就要复杂一些,OpenCV等采用多项式的形式去近似入射角和成像的关系。*opencv的鱼眼相机模型,采用直接近似的形式,误差比较大,并不适合一些精确的计算。目前常见的鱼眼镜头类型有下面几种,他们都有一些有意思的特性,感兴趣的小伙伴可以去了解一下。St
2020-06-13 18:32:06
633
转载 Windows Ceres 编译安装
Ceres Solver是一个C++环境下的非线性最小二乘问题的求解工具包,可用来建模并解决大型复杂的非线性最小二乘问题。这个工具包已经广泛被用于很多商业软件中。在google project里面有它的主页: http://code.google.com/p/ceres-solver/。环境Windows 10 ProVisual Studio 2015Cmake GUI 3.10....
2020-03-21 15:47:07
1963
1
原创 【OPENCV源码阅读】鱼眼镜头标定
Opencv的鱼眼镜头模型空间中的三维点,对应世界坐标X,相机坐标系下坐标为XcX_cXcXc=RX+TXc=RX+TXc=RX+TR是旋转对阵,对应于旋转向量om;x,y,z是XcX_cXc的三个坐标值x=Xc1x=X_{c1}x=Xc1y=Xc2y=X_{c2}y=Xc2z=Xc3z=X_{c3}z=Xc3针孔成像模型下P的坐标(a,b)(归一化平面坐标)a=x/za...
2020-03-03 19:43:40
2058
转载 Linux 中直接 I/O 机制的介绍[转]
直接 I/O 的动机在介绍直接 I/O 之前,这一小节先介绍一下为什么会出现直接 I/O 这种机制,即传统的 I/O 操作存在哪些缺点。什么是缓存 I/O (Buffered I/O)缓存 I/O 又被称作标准 I/O,大多数文件系统的默认 I/O 操作都是缓存 I/O。在 Linux 的缓存 I/O 机制中,操作系统会将 I/O 的数据缓存在文件系统的页缓存( page cache ...
2019-08-26 00:09:14
169
翻译 TeX家族整理(扫盲文)
TeX 家族带有 TeX 的词,仅仅是本文就已经提到了 TeX, LaTeX, XeLaTeX。通常中国学生面对不了解意思的一群形近单词,都会有一种「本能的恐惧」(笑~)。因此,「大神们」在为新手介绍 TeX 的时候,如果互相争论 「XXTeX 比 YYTeX 好」或者是「XXTeX 的 YYTeX 如何如何」,往往会蹦出下面这些带有 TeX 的词汇:TeX, pdfTeX, XeTeX, ...
2019-04-04 19:49:35
495
转载 对缓存的思考——提高命中率
开篇编写高效的程序并不只在于算法的精巧,还应该考虑到计算机内部的组织结构,cpu微指令的执行,缓存的组织和工作原理等。好的算法在实际中不见得有高效率,如果完全没有考虑缓存、微指令实现的话。前两篇博文局部性原理浅析 介绍了程序的局部性原理,如何写出局部性良好代码。提高程序性能、何为缓存 讨论了存储器层次结构,计算机内部的存储结构、缓存的概念,简单的介绍了缓存的工作机制。建议先...
2018-10-19 17:02:46
212
原创 C++之类型转换
C++类型转换形式很多,尤其是隐式转换的模糊很容易导致程序的各种问题。所以我参考了Cppreference简单做了一点总结:一:算数隐式转换 当表达式两个值进行运算时,首先会进行类型提升,其提升规则如下:简单点来说,当两个值进行运算时,会将两个操作数都提升为等级最高的操作数的类型。(上图从左到右等级由低到高)但是当两个操作数都为int型及其以下时,会将其全部提升为i...
2018-10-12 22:13:07
911
转载 YUV文件格式
原文:YUV图像格式的博客转:https://blog.youkuaiyun.com/armwind/article/details/52190123,文章不错特转载过来备忘一.YUV数据格式的定义和采集方式1)YUV数据格式定义 YUV分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chroma)...
2018-08-01 00:41:17
11409
bmp图像文件的简单读写库
2023-06-04
python-gui 文件批量重命名
2022-03-13
ceres2.0及其依赖的源代码
2021-09-11
ceresEnviroment.zip
2020-03-23
moedelsim 10.1c用户手册(英文版)
2018-09-09
IEEE Standard for Verilog 2001版和2005版
2018-07-15
linux第三方库不区分debug和release版本么?
2019-04-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人