- 博客(69)
- 收藏
- 关注
原创 衍射受限系统中在相干和非相干照明条件下的点扩散函数
考虑的系统:单透镜成像系统,用一平面波照明位于平面 z = -d1 上的透明物体, 则这个面上的波场为U(x1,y1,-d1)。首先确定平面z=d0 上的波场U(x0,y0,d0), 然后讨论成像的条件。几何光学是一种理想情况,与之对应的是衍射光学的内容,而本文主要探讨的是衍射光学范畴下的衍射受限系统中在相干和非相干照明条件下的点扩散函数(Point spread function)、线扩散函数(Line spread function)、边扩散函数(Edge spread function)。
2024-11-20 11:46:16
937
原创 【NeRF及其代码NeRF-Pytorch实现】
位置编码(增强高频信息):对于位置xyz坐标(对于两个不同的位置坐标都采用了位置编码,但是所使用的项数不同,相机位置使用10,而相机方向的坐标使用4),文章采用了位置编码的方式,具体而言,对于每个维度,使用cos和sin来编码,并且对于每个cos和sin,都是用了十项,所以输入维度变成。输出:NeRF采用体积雾的渲染方式,NeRF模型的直接输出为采样点的颜色RGB以及不透明度信息,通过后处理(体积渲染进行积分,后面会提到)的方式得到最终渲染好的图像。一个batch包含很多不同位置像素+位姿。
2024-08-07 12:01:07
1023
原创 【文献阅读】End-to-end compression-aware computer-generated holography/端到端具有压缩感知能力的计算全息术
【文献阅读】End-to-end compression-aware computer-generated holography/端到端具有压缩感知能力的计算全息术。
2024-07-05 11:56:41
414
原创 CompressAI benchmark经典/传统图像编码器的使用
CompressAI的github仓库中Usage-Evaluation给出了传统编解码器的使用帮助,但是并未给出详细的使用方法。本文旨在进行总结使用方法。下图是传统编解码器相关代码的存放地点,其中codecs为各种编解码器类的定义模块module,被__main__调用。各个编解码器的输入参数的要求在codecs中可以找到,数据集路径参数是必须的。# 要注意的是 # 在通过python -m script运行脚本的时候,不需要加上后缀 python -m __main__ jpeg。
2023-12-13 14:26:52
523
2
原创 【光电子技术+光纤通信】博资考
首先介绍一部分能级理论。当施加反向电压时,刚开始,外电场和内电场合力大于扩散力,P型的电子和N型的空穴被搬运回N型和P型,导致浓度差更大,因此热分子运动的力增大,最终达到平衡,反向电压在一定程度范围内,都无法产生电流。:对于多纵模输出的激光器,各个模之间的相位差是随机混乱的,导致最后输出的激光是随机混乱的。,APD雪崩光电二极管,由光子激发的空穴-电子对在耗尽层产生,空穴向上运动,电子向下运动,电子在雪崩层经过加速后,撞击原子激发出新的空穴电子对,形成链式效果,因此APD的敏感度和反应时间性能很好。
2023-10-25 08:52:57
1182
原创 【计算摄像学】博资考
相机所能记录的光强范围有限,当超过能记录的最强光强之后,相机传感器会出现饱和的情况,如0-255之间,但是拍摄多张图像之后然后把值进行相加,则动态范围得到扩大,如四张不同曝光(快门速度,光圈大小,ISO)图片之和动态范围变成0-1020。双边滤波包括空间域核和值域核,两个核相乘得到总体的核,两个核的数学形式类似,都类似于二维高斯分布。使用双边滤波还可以用作增强图像,比如滤波后的图像是低频分量的图像,图像的边缘被保留,原图像减去改双边滤波后的图像得到边缘去除的图像,然后加回原图像即可避免图形边缘处产生光晕。
2023-10-24 17:37:43
268
原创 KL散度与率失真优化问题
为0时,意味着真实分布在这里为0,则真实分布和拟合分布之间的差异不考虑,这样拟合出来的分布往往不局限于多峰分布中的某个峰,而是趋于寻找极大似然估计。而这个近似的直觉思路是通过反向KL散度来设计。但是KL散度中存在上述的intractable的问题,因此希望把KL散度的优化问题转化为其他的优化函数。很小时,KL散度相应权重很小,意味着不考虑拟合分布概率密度小的地方,这样拟合的分布会陷入某个单峰的拟合中。正向KL散度和反向KL散度并不相等,意味着KL散度并不具有对称性,在不同的情况下需要使用不同的公式。
2023-09-21 17:57:26
338
转载 windows编辑系统变量时,path变量显示一行
按照如下流程想要编辑系统变量时,出现只显示一行,路径都挤在一起通过“;”分隔。环境变量→系统变量→Path编辑。
2023-09-15 15:54:05
985
原创 新入职导师指导能力低,喜欢给压力,如何破?
帮我修改论文之前也没有仔细看过我的文章(这句属于我的推测,可能看了但是没看懂,怎么可能看懂,看懂了能不知道我的文章想做什么,核心思想是什么吗?),属于临阵磨枪,只能文字表达方面做修改(而且由于是临时修改,加之他对这个领域不熟悉,属于是乱改),对方案和实验完备性方面无法提出任何有效意见。最近的一个课题从idea的提出到实验,到论文初稿完成,中途一直有和导师以及其他学校的合作者汇报工作进展,算是比较独立地完成,但是直到他给我修改初稿时才理解我这篇文章的目的与核心思想。很苦恼,学术生涯到底会走向何处?
2023-08-23 10:43:27
153
原创 移动硬盘出现两份多个分区并无法使用的情况
但是没有效果,我选择下载了DiskGenius,然后找到所有分区格式化(可以格式化的格式化),然后在操作系统下:win+Q,搜索计算机管理,打开磁盘管理,把我移动硬盘的所有分区都删除,然后新建卷,一路默认设置,最后能在此电脑下看到正常的分区。移动硬盘借给组内同学装Ubuntu之后,出现多个分区,windows10操作系统识别到两个分区并且无法读取,并且出现格式化提醒,但是由于只读属性,而无法格式化的情况。在插入移动硬盘的时候,会卡死在bios选择界面,暂时没有办法解决。
2023-08-23 09:50:44
647
原创 试图重新捡起写博客的习惯
随后由于不可抗逆的原因,现在课题转为了全息图压缩编解码。断断续续地,在各个网络平台上写过一段时间的文字,包括个人经历、技术总结和其他一些乱七八糟的东西,但是缺乏总体性和连贯性,最近一段时间也是断掉这个习惯了,日益感觉到自己的懈怠,脑子里面涌现出一些懊悔的情绪,所以想要借助优快云这个平台再把之前的习惯继承下来。至于能坚持多久,我也不能给出一个肯定的答案。所以之后的博客主题主要集中在常规图像和视频编解码标准和算法的解读,全息图压缩编解码的探索。
2023-08-22 14:18:24
131
原创 模型权重初始化
模型的正向传播和反向传播都是基于矩阵乘法来实现,当网络很深的时候,在更新模型参数时,梯度值可能很大或者很小,导致梯度爆炸和梯度消失的问题,网络不稳定、无法收敛的现象。除了残差块、梯度归一化、激活函数等方式外,合理的网络权重初始化也是一种缓解梯度消失和梯度爆炸的重要方法之一。合理的权重初始化内涵是:合理控制每一层的输出和梯度大小,并使得输入和输出的均值和方差保持一致。kaiming初始化方法为了解决xvaier初始化方法在非对称的激活函数如relu激活函数上表现不佳的问题而提出的。...
2022-08-27 16:24:59
610
原创 空洞卷积、可变形卷积、可变形ROI Pooling
基本原理:Dilated/Atrous Convolution(中文叫做空洞卷积或者膨胀卷积) 或者是 Convolution with holes 从字面上就很好理解,是在标准的 convolution map 里注入空洞,以此来增加 reception field。相比原来的正常convolution,dilated convolution 多了一个 hyper-parameter 称之为 dilation rate,指的是kernel的间隔数量(e.g. 正常的 convolution 是 dilat
2022-06-25 08:54:55
1940
原创 使用Git进行项目的基本管理
前提:已注册GitHub账号,并在GitHub中创建了私有/共有仓库,已经安装Git,使用Windows操作系统需求:在服务器和终端主机上同步项目提示:文章质量有待提高,属于基础内容步骤cd到需要管理的项目下文件夹内, 鼠标右键Git Bash Here, 使用Git init创建工作区切换用户命令:git config --global user.email "email address here"git config --global user.name "user name he.
2022-04-07 16:31:29
1839
1
原创 检查两台主机是否同处于一个局域网
一般来说,在校园的情况下,实验室服务器和宿舍/工位的主机在同一个局域网内,对外有相同的外网IP地址,对内有不同的内网IP地址,基于此可以通过ssh/安全外壳协议连接两台主机,并进行通信:远程调试代码。关闭防火墙查询局域网内ip地址(用ipconfig)ping 对方IP地址ping ipv4_address...
2022-03-30 11:21:57
3494
原创 Nvida cudatoolkit,nvcc,cudnn,GPU,显卡,显卡驱动,conda,python,pytorch之间的基本问题
(1)概念Nvidia是一家人工智能计算公司,专长是做GPU,做出来的显卡叫做N卡,做深度学习尽量使用N卡GPU指图形处理器(英语:graphics processing unit,缩写:GPU),是显卡上的芯片,相较于CPU它内核数量多,核内缓存小,计算单元多,可以大量进行并行计算,专长是处理图像相关的计算。显卡驱动:很明显就是字面意思,通常指NVIDIA Driver,其实它就是一个驱动软件,而前面的显卡就是硬件,实现硬件和软件之间的通信CUDA是 NVIDIA 发明的一种并行计算平台和编程模
2022-02-18 10:56:36
1373
原创 相位提取算法简介(Phase Retrieval/PR)(待更新)
文章目录前言Gerchberg-Saxton AlgorithmFienup AlgorithmWirtinger Flow AlgorithmDouble Phase Coding AlgorithmDouble Phase Amplitude Algorithm存在的疑惑:使用ASM实现ITFA,是否在物理实现是还需要加上傅里叶透镜?使用基于FFT2实现的ITFA,在使用FFT2时,重建效果好,但是不适用于近场,使用最基本的ASM时,重建效果也很好,但是不适用于远场,使用线性卷积时,效果不好,有振荡
2022-01-08 20:31:23
7418
5
原创 简单计算全息光路搭建
文章目录光学设备:532nm激光器、平凸透镜、偏振分束器、LCOS-SLM空间光调制器、白屏各设备作用:激光器做光源平凸透镜用作扩束偏振分束器用于光束光路引导,并改变偏振状态以适应SLM空间光调制器用于空间光调制白屏用于显示图案测试:PC显示模式选择扩展模式,并且设置第二显示器分辨率为1920x1024;或者使用复制模式,显示器上(取决于你用哪一个)使用照片查看器打开某明显图案,然后使用偏振片观察是否出现相应图案。软件使用:PC安装displaylink驱动,用于use外接显示。P
2022-01-07 23:04:13
1173
2
原创 使用服务器远程调试代码:内网Windows主机+内网Windows服务器+ngrok内网穿透+openssh连接+vscode调试代码
内网主机+内网主机+内网穿透+ssh连接
2022-01-04 12:58:13
1274
原创 如何戒除B站
B站于我而言,公平公正的来说,是既有利也有弊的,那究竟利弊如何呢?从前总是浑浑噩噩,没有用心来估量过,今日专门找了个下午的时间,痛定思痛,一定要得出一个结论,完成对它的最终审判。最开始,我想是由于好奇而入坑的,大概是在大一的时候,当时在央视新闻上看到了它,说它存在一些露骨的东西,就没有产生好的第一印象,只是很鄙视它,还有就是在玩撸啊撸的过程中,某人的读留言读评论环节总要讲到一些来自B站的,当时总是觉得奇怪,但后来耐不住好奇心,便一发不可收拾了。说到涉猎范围,应该可以用饥不择食来形容了,大概是:生活、开.
2021-12-20 16:40:16
2886
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人