tony365-优快云博客

原创将图像数据按照patchsize和stride crop为patch并保存。利用np.memmap映射文件数据方便读取

【代码】将图像数据按照patchsize和stride crop为patch并保存。利用np.memmap映射文件数据方便读取。

2025-03-18 17:00:15 232

原创大的图像内存占用太大，分块处理

【代码】大的图像内存占用太大，分块处理。

2025-02-24 11:02:52 122

原创 video interp_Sparse Global Matching for Video Frame Interpolation with Large Motion论文解释

local feature branch 和 sparse global matching branchlocal feature branch 主要包括 local feature extractor, flow estimation, refine net三个小模块：local feature extractor 是CNN and Transformer hybrid structure, 用于特征提取。

2025-02-12 14:03:33 692

原创 sql layer 在depth prediction中的解释

由于自己的数据和 vimeo90k的数据在场景，噪声，画质等是由差异的，所以预期会有一点作用，但是也会有不适应的地方。就是多引入一个block，block的输入会引入gt信息，然后得到的teacher flow结果对原先的flow进行监督引导。后续finetune后应该会更好的。deconv红色的注释有误，应该是out = 2 * in (图像的尺寸，不是channel)官方源码VimeoDataset 处理vimeo 数据，修改源码的路径为自己的数据路径即可。unet输出的是 fusion的图像的残差。

2025-02-10 09:16:00 310

原创 Eigen使用

eigen库在visualstudio中的使用：只需要添加包含目录即可。

2025-01-20 15:41:33 978

原创 optuna和 lightgbm

optuna支持很多种搜索方式：（1）trial.suggest_categorical(‘optimizer’, [‘MomentumSGD’, ‘Adam’])：表示从SGD和adam里选一个使用；（2）trial.suggest_int(‘num_layers’, 1, 3)：从1～3范围内的int里选；（3）trial.suggest_uniform(‘dropout_rate’, 0.0, 1.0)：从0～1内的uniform分布里选；

2024-12-25 10:32:09 1133

原创一维数据预测FilterNet: Harnessing Frequency Filters for Time Series Forecasting

一共以下几个步骤：norm: 求每个特征的均值和方差（seq_len个数的均值和方差），以及normfilter: x是输入，w 是可学习的滤波系数，将两者转换到频域，相乘，再转回来。

2024-12-06 16:11:53 1288 2

原创 gamma: CE Brightness-Distorted Images by Improved Adaptive Gamma Correction(2017)(附python)

首先计算累积直方图c，gamma = 1-c然后 apply gamma:通过以上可知 gamma和累积直方图有关系。因此对直方图进行不同程度的平滑可以得到不同的累积直方图, 如下图b: alpha=0.5,1,1.5时的累积直方图的变化梳理一下主要步骤：对YUV的Y 或者 hsv的v 通道处理1）首先计算直方图p2) 然后根据公式2计算 pw, normalized后的 pw’=pw/pw.sum(), 这里有参数alpha可调3) 然后计算累积直方图c, 和 gamma=1-c。

2024-11-22 14:39:56 756 1

原创 gamma cor:An adaptive gamma correction for image enhancement(2016)

低对比度图像

2024-11-22 13:55:37 390

原创 cuda, cudnn, ternsorrt, cvcuda安装

https://cvcuda.github.io/CV-CUDA/installation.html 是安装和使用教程安装好之后要设置环境变量，参考https://blog.youkuaiyun.com/Deaohst/article/details/138472286https://github.com/CVCUDA/CV-CUDA/releases 是安装文件。

2024-11-08 14:19:37 377

原创 opencv 打印优化信息

【代码】opencv 打印优化信息。

2024-10-21 14:15:25 111

原创 flow based generation model

张振虎的博客：https://www.zhangzhenhu.com/glm/source/%E6%9C%80%E5%A4%A7%E4%BC%BC%E7%84%B6%E4%BC%B0%E8%AE%A1/content.html。最后介绍了2个模块，这两个模块求G的逆和 G的juacobi矩阵的行列式的值都比较容易计算。slogdet 计算行列式后，取绝对值再取log, 返回行列式的符号和最终结果。因此关键就是求解 G的逆和 G的jacobi矩阵的det。设计模块的时候也要考虑的逆和行列式的计算。

2024-10-08 14:18:26 383

原创 hdr tone mapping介绍2

https://blog.youkuaiyun.com/qq26983255/article/details/108541074

2024-09-26 17:23:59 333

原创膨胀腐蚀操作opencv dilate膨胀白膨胀，erode腐蚀是黑吃白。主要针对二值图

【代码】膨胀腐蚀操作opencv dilate膨胀白膨胀，erode腐蚀是黑吃白。主要针对二值图。

2024-09-10 11:35:34 345

原创 predictive-filter-flow

网络是输入 noise image (n,c,h,w), 输出 filter (n,17x17,h,w) 其中17是filter的领域大小，就是为每个pixel生成一个17x17的滤波器。然后对inputa, inputb都缩放2，4，，8，16，32倍五个尺度，缩放可以用opencv resize,或者其他的都可以的，作者源码用 transforms.Resize。求梯度的kernel,包括水平和竖直: [1,-1], [1,0,-1], [1,0,0,-1], [1,0,0,0,-1]

2024-08-30 09:12:44 952

原创 pytorch, torch_tesnsorrt安装各版本匹配

python -m pip install torch2.3.0 torchvision0.18.0 torch-tensorrt2.3.0 tensorrt10.0.1 --extra-index-url https://download.pytorch.org/whl/cu118

2024-08-22 10:13:22 355

原创 sdapRandom Sub-Samples Generation for Self-Supervised Real Image Denoising

ap-bsn 转换为公式3，然后pd是固定的。

2024-08-10 14:11:34 510

原创 MM-BSN

作者分析了一个图像，发现噪声相关性在距离大于5（面积大于25）仍然比较大的像素比例占了三分之一。作者相比 ap-bsn主要修改了网络，相比与ap-bsn的单个center mask conv。本文提出两种mask, 希望一种打破相关性，另一种保留纹理细节。两种结合，更好的降噪。之前论文说到邻域为5以内的噪声相关性比较大，距离大于5的时候相关性较小。

2024-08-10 14:08:36 320

原创 APbsn

在另一个相对本文改进的方法Random Sub-Samples Generation for Self-Supervised Real Image Denoising我也进行了相关实验，这次直接使用官方代码只改了数据集，可以得到类似的结果，就是blind spot net得到的图像都很平滑。pda,pdb分别为2，2的时候，得到的结果A,B会稍好一些，多一些细节，但是仍然缺失很多纹理，不是很满意。pda,pdb分别为5，2的时候，得到的结果A,B都很平滑。就是训练的时候 stride=5 去相关。

2024-08-09 10:14:38 1320

原创 Asymmetric Mask Scheme for Self-Supervised Real Image Denoising:down susampling mask

训练的时候 only_first=true, 因此只有一个mask其作用，其实就是随机mask 50%像素建立损失，进行训练。默认2个mask互补，降噪后的图像被mask的区域互补组成完整的denoised image，参看6.3。但是推理的时候用到多个mask, 所有被mask的像素是组成真个图像尺寸。推理的时候mask满足，多个分支所有被mask的像素构成整幅图像。也就是n个mask的情况下，mask=0的区域占n分之一.总的来说，就是用未被mask的像素预测mask的像素。

2024-08-07 19:40:00 917 1

原创单张图像降噪Masked and Shuffled Blind Spot Denoising for Real-World Images

3）但是总的效果是，噪声空间相关度越小，越容易降噪，降噪效果最好，细碎的噪声更容易去除，这个很有道理，也符合常识，空间相关度大的噪声比较难以区分是纹理还是噪声。2）对于噪声空间相关度大的图像， mask ratio越大越好，这个也好理解，mask ratio越大，网络学习更多内容相关的推理能力。beta = 1的时候，空间噪声有比较高的相关度，某个像素的噪声是 5，则相邻像素的噪声和 5比较接近，就是相关。每个像素被mask的概率，其实也是整张图像被mask的比例，概率 tao。

2024-08-06 15:33:46 1232

原创 deepflow相关spynet, pwc, raft, uflow, upflow, Back to Basics,unflow, homoflow8base

实际训练自己的图像，flow一直全为0，loss 停止，这在github issue中也有人遇到类似的问题，为什么学习不到内容呢？level i:n,5x5,h,w -> 24,1 相减—> boxfilter n,24,h,w—> top position x,y–>flow。训练的时候，model input是两张图像： batch_size, 6, h, w。这样我们通过上面的公式可以得到前向遮挡区域和后向遮挡区域的mask。输出第二张图像的flow, 和第二张图像的warp。

2024-08-02 16:27:23 1027

原创多光谱的空间特征和光谱特征Statistics of Real-World Hyperspectral Images

图8很有意思表示的是第二个spatial basis 与排名1，2的两种spectral basis组合的系数分布图，接近高斯分布。每个spatial basis 和不同的spectral basis组合后的趋势是大概相同的。x 的j,k表示的是 spatial basis和spectral basis的序号。C1 的重要性不言而喻，与其他spatial basis组合都可以由高的方差。不同的spatial特征和光谱特征组合后的方差是怎样的？求得的spatial的特征应该和一般图像求的一样把。

2024-07-19 19:37:36 911

原创 # ffmpeg 工具使用

windows安装教程：https://blog.youkuaiyun.com/csdn_yudong/article/details/129182648。图片的文件名为"in000000.jpg"，从0开始依次递增。img%04d.jpg: 生成的图片命名格式。-f : 指定格式化的格式为image2。第二种方法生成的图片大小为260kb左右。-b 200k 指定码率为200k。fps=1/5: 每1s取5帧。%5d：以为5位数按正序编号。fps=5: 每5s取一帧。-i : 指定输入文件。-r : 帧数 10。

2024-07-17 11:03:42 1068

原创关于pytorch的加载数据，cpu init, cpu getitem, gpu init

如果GPU显存比较大的时候，或者有多个GPU的时候，可以在init函数中将图像读取到若干个GPU中。但是读取到GPU之后，训练的时候好像不能使用dataloader，容易报错。这种方法可以处理大数据集，比如所有图像占用内存大于电脑内存的时候，用这种方法。但是由于读取图像放在了get_item中，训练的时候加载数据会比较慢。就是cpu内存不够不能使用方法一，且我们不像速度太慢不能使用方法二。这种方法比较常用，读取图像的效率也高，但是cpu内存要够。这个时候自己设计一个批处理函数，和shuffle。

2024-07-04 14:28:06 511

原创 gplearn 和 deap

很有条理的教程：https://www.jianshu.com/nb/37113069。基于DEAP库的Python进化算法从入门到入土—(二)简单遗传算法实现。感觉使用起来很麻烦呀。

2024-06-24 20:56:35 366

原创内窥镜窄带光

染色很有意思，通过控制五种LED来达到不同的色彩模式。五种LED是 1种白光+4种窄带光。还有智能分光技术，是利用多光谱的方法分解后再重建图像，和之前做的多光谱重建类似。VIST成像只采用蓝紫光和绿光，不采用红光和蓝光。没有找到官网，和相关信息。有一些窄带光成像的专利。SFI成像光源相比白光，蓝紫光更强，红绿光较弱。官网页面未发现 NBI相关信息，只有荧光方案。有SFI 成像技术和 VIST成像技术。搜集到的与NBI，相关的信息如下。第二直接搜索找不到相关信息。没有相关信息，相关技术。

2024-06-17 09:39:57 363

原创图像融合：可见光和红外图像Visible and NIR image fusion using weight-map-guided Laplacian–Gaussian pyramid f

首先weight map的计算和 mertens有所不同。mertens方法中，主要使用了亮度，对比度，饱和度三个概念。local contrast的实现效率比较低，先stack在一起多层。借鉴了 mertens的方法，进行rgb和nir图像的融合。然后 V 与 NIR图像计算weight map。然后高斯-拉普拉斯金字塔融合，得到新的V。rgb转换到 HSV，对比度增强，就是锐化。

2024-06-11 16:21:29 282

原创多曝光融合算法（八）：MEFLUT: Unsupervised 1D Lookup Tables for Multi-exposure Image Fusion

是不是满足这个条件可以看下通过设置图像输入，相同灰度的像素输出的 weightmap是不是也是相同的。查找表没有利用语义信息，可能不够平滑，即使假如guide filter,guide filter的参数也不能自适应调整。输入一个图像全为0，得到K个weight map，求这k个weight map的mean, 作为。还有一个最终要的问题就是。这样的假设相当于认为，网络学到的映射关系是只与单个像素值有关系。效果不如本文提出的网络，说明本文提出的网络转换为1Dlut 更加有效。

2024-06-06 14:23:41 1085 1

原创多曝光融合算法（三）cv2.createAlignMTB()多曝光图像融合的像素匹配问题

异或运算计算差异的时候还有一个问题是在均值附近的一些区域，两张不同曝光的图像的二值图可能被引入一些噪声，此时可以计算图像的 exclusion mask,标记，在均值[-4,4]的区域。计算均值和中值的时候，对于严重过曝或者过暗的图像，可能因为大量的255，0像素导致计算的均值接近255和0。那么我们通过遍历其中一个图像的位移dx,dy,计算 error_sum，寻找最恰到的dx,dy。还有特殊的图像就是多帧曝光，小位移，重合区域多，但是亮度差异有点大。而且计算的是全局的位移。介绍了一些配准方法。

2024-06-06 13:57:04 898

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

7中fft方法测试，速度比较

prtorch train

cie software

SIMD Tutorial.pdf

bus 序列图测试图像，可用于降噪

傅里叶变换及其应用（斯坦福大学stan）.pdfbook.rar

fxtbook.pdf book.rar matting

mfc:单文档中对话框类调用视图类和框架类成员变量的实例

空空如也