- 博客(20)
- 收藏
- 关注
原创 关于计算机图像的一些先验知识
以下图片与部分结论来自论文"Why You Should Forget Luminance Conversion and Do Something Better, Rang M. H. Nguyen, Michael S. Brown, CVPR2017"
2024-06-11 23:12:38
1019
原创 epoch和iteration的区别
进行一次前向和后向传播。在一个 epoch 中会有多个 iterations,其数量取决于训练集的大小和批次大小。假设训练数据集有 1000 个样本,批次大小为 100。:一个 epoch 完成时意味着网络已经使用了。这包括对所有批次的多次迭代。:一次 iteration 是指对训练数据的。
2024-01-11 21:07:31
1580
原创 Information Maximization (IM) loss
再把各样本分类概率(64,9)按列求均值后,得到每个类别的平均预测概率(9,)因此每个概率综合不同样本概率(多样性)即整个batch的平均输出的熵。,将classifier feature softmax (64,9),对每个样本计算entropy,加和后取期望值,得到。分类任务,设output.size为(64,9)即batch-size 64,num-classes 9。对每个单独的样本给出确定性的预测,而且在所有样本上给出均衡的预测(增加多样性)。可以理解为个体entropy loss,
2024-01-10 21:53:25
688
原创 torchvision.transforms用法及图片增强方法
在 PyTorch 的 `torchvision.transforms` 中,大多数变换都是设计为应用于PIL 图像格式的。
2023-12-27 21:38:58
2144
1
原创 目标检测&分割相关
它的主要作用是减少重叠的边界框数量,保留最佳的边界框,并去除那些较不重要的边界框。3. **计算重叠程度**:计算其他所有边界框与参考框的重叠程度,通常通过计算它们的交并比(Intersection over Union, IoU)。4. **去除重叠边界框**:如果一个边界框与参考框的IoU超过了预设的阈值(表示它们重叠得太多),则这个边界框会被去除。5. **重复过程**:从剩下的边界框中再次选择置信度最高的框作为新的参考框,并重复上述过程,直到所有的边界框都被处理过。
2023-12-05 21:38:34
1335
原创 常用的Loss & Distance (& Similarity)
多用于分类任务中。交叉熵是衡量两个概率分布之间的“距离”或相似性的度量。对于真实概率分布 p 和模型预测的概率分布 q,交叉熵定义为:x 是可能的事件或类别,p(x) 是真实概率,q(x) 是模型的预测概率。在机器学习的分类问题中,真实的类别通常用一个"one-hot"编码的向量来表示,其中只有一个位置是1(代表正确的类别),其他位置都是0。而模型的输出则是一个概率分布,表示每个类别的预测概率。对于二分类任务:对于多分类任务:,其中是label的是。交叉熵损失对模型的错误预测给予了高的惩罚。
2023-10-02 14:57:43
370
1
原创 SINKHORN && 二次分配问题等
对于问题的每一个正面答案(即答案为 "是"),如果存在一个多项式时间算法,该算法可以验证一个提供的证据(或解)是否正确,那么这个问题就属于 NP 类。
2023-09-30 15:09:04
813
1
原创 pytorch basic(二)detach&contiguous&切片
返回一个新的tensor,从当前计算图中分离下来的,但是仍指向原变量的存放位置(当一个被修改,另一个也会修改),不同之处只是requires_grad为false,得到的这个tensor永远不需要计算其梯度,不具有grad。即在网络训练过程中希望某些变量的参数不保持更新,切断一些分支的反向传播。
2023-07-29 16:28:30
185
1
原创 制作Dataset,生成Burst
code from Dudhane, Akshay, Syed Waqas Zamir, Salman Khan, Fahad Shahbaz Khan和Ming-Hsuan Yang. 《Burstormer: Burst Image Restoration and Enhancement Transformer》. arXiv, 2023年4月3日.
2023-07-22 14:34:54
292
原创 相机先验知识
在相机成像系统中,将场景亮度(scene radiance)与图像强度(image intensity)联系起来的函数称为相机响应。
2023-07-18 18:50:38
194
1
原创 机器学习基础(用去噪方法理解监督学习种类)
可视为无监督学习,标注信息都来自于数据自身。不给样本,而是给出一个代表某一类物体语义的embedding。部分,而zero-shot在模型重在模型训练好后的下游task。:已知数据没有任何标签,将所有数据映射到不同标签。:大量未标记数据和少量标签数据。:数据与标记有一一对应的关系。
2023-06-15 20:41:51
443
1
原创 Padding picture
Jin, Xin, Ling-Hao Han, Zhen Li, Chun-Le Guo, Zhi Chai和Chongyi Li. 《DNF: Decouple and Feedback Network for Seeing in the Dark》, CVPR2023.stride由Unet架构的层级数layers决定,layers=4,stride = 8。当输入图片h=w=233,由上式 上下填充7值h=w=240.关键步骤:dh = -h % stride,dw = -w % stride。
2023-06-12 20:24:53
318
1
原创 Progressive learning
True 结果为[True, True, True, True, True, True],则nozero返回(array([0,1,2,3,4,5]),) ,nozero[0] = [0,1,2,3,4,5].在小的crop patches上训练Transformer模型可能无法对全局图像统计进行编码,从而在测试时对全分辨率图像的效果不佳。网络在早期的时代在较小的图像patch上进行训练,在后期的训练时代在逐渐变大的patch上进行训练。sequence: 可以是一个列表,元组,字符串,或集合。
2023-06-12 20:14:47
527
1
原创 Pytorch DataLoader
因为当shuffle == False,sampler是SequentialSampler,就是按顺序取样。当shuffle == True,sampler是RandomSampler, 就是按随机取样。当sampler有输入时,参数shuffle的值没有意义。
2023-06-12 17:58:53
91
1
原创 python基础函数&用法&报错
对两个可迭代对象同一位置打包,返回为tuple。如果几个参数不等长,取最短的那个参数的长度,舍弃超出最短长度的成员。
2023-06-08 14:10:20
62
1
原创 fvcore basic
fvcore是一个易用的工具。fvcore是Facebook开源的一个轻量级的核心库,它提供了各种计算机视觉框架中常见且基本的功能。其中就包括了统计模型的参数以及FLOPs等。
2023-06-07 20:34:08
362
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人