自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 Jetson nano +达妙载版 安装系统记录

3. 选择jetson linux 选择 i accept 下一步。target hardware 显示识别到板子 然后continue。输入新系统用户名和密码 固态硬盘 NVMe 然后Flash。用开发板 短边的type-C 连接 笔记本电脑。4 如果看到 这个界面 笔记本的操作就结束了。·不用管这个 全部跳过。然后安装wifi驱动。1.安装 SDK manager 并打开。重新启动等一会 就可以看到wifi图标。按下图中标红按钮 同时 上电 接电源。2.开发板 连接 显示器。

2025-11-06 17:55:32 285

原创 jetson Orin 配置pytorch环境记录

用源码编译的方式,安装了torchvision 但是import torchvision检查后还是报错 ,报错什么记不太清了,但是可以在cuda cpu上运行了。这里要记录一下 第一次安装时 python环境和conda环境的冲突 本来我在conda环境中安装pyotch,但是gpt推荐要安装python,好,那尝试一下最新的版本:就是在1.pytorch安装中的结果 是没有问题的。这里应该安装的包太旧了,适用于cudnn8,但是我的板子是cudnn9.注意要用pip安装,不能用conda安装。

2025-07-12 14:03:56 951

原创 概率体积(Probability Volume)

概率体积(Probability Volume)在深度估计和计算机视觉领域中,特别是在多视图立体匹配中,是一个重要的概念。它表示在每个像素位置处不同深度的可能性分布。定义:概率体积是一个5维张量,通常表示为 ((B, D, H, W)),其中:计算过程:在深度估计任务中,概率体积通常通过对代价体积(Cost Volume)进行Softmax操作得到。代价体积存储了每个像素位置在不同深度假设下的匹配代价,通过Softmax操作将这些代价转换为概率。数学上,对应某个像素位置 ((x, y)) 和深度 (d)

2024-08-02 16:01:35 443

原创 homo_warping

这个函数通过将源图像的特征图根据参考图像的视角和一系列深度值进行重投影,实现了多视角几何中的特征对齐。这样可以在不同的深度层上对源图像的特征进行采样,生成在参考视角下的特征图,用于后续的深度估计或三维重建等任务。

2024-08-01 10:54:38 445

原创 单应性变换函数

为了更好地理解这个过程,我们可以一步一步地解析每个操作的目的和它在整个流程中的作用。

2024-07-31 21:51:28 426

原创 内参矩阵(intrinsics)和外参矩阵(extrinsics)相乘

通过将相机的内参矩阵(intrinsics)和外参矩阵(extrinsics)相乘,得到投影矩阵(projection matrix)。投影矩阵用于将3D点投影到2D图像平面上,这在计算机视觉和多视图立体(MVS)中非常重要。下面详细解释这段代码的每一行及其背后的含义。

2024-07-30 10:28:50 867

原创 `Dataset` 类中的`__getitem__` 方法

在 PyTorch 的Dataset类中,方法是一个核心方法,它在数据加载时被调用。具体来说,

2024-07-29 11:27:31 1227

原创 MVSnet元数据

元数据在多视图立体视觉任务中起到了重要的组织和管理作用,帮助系统有效地处理和利用大量图像数据。通过提供数据的描述、结构和管理信息,元数据确保了数据处理过程的高效性和准确性。

2024-07-29 10:51:58 520

原创 MVSnet-pytorch网络的损失函数

生成有效区域的掩膜:通过将掩膜值大于 0.5 的位置设置为True,创建一个布尔掩膜。应用掩膜:在计算损失时,仅考虑掩膜值为True的位置,以忽略无效区域。计算 Smooth L1 损失:使用 Smooth L1 损失函数计算深度估计值与真实深度值之间的差异,并返回损失的平均值。这种损失函数在训练 MVSNet 模型时,有助于优化模型的深度估计精度,尤其是在处理有噪声的深度数据时,Smooth L1 损失的鲁棒性能够提高模型的稳定性。

2024-07-27 21:24:17 557

原创 MVSnet的代价体积处理/CostRegNet/3D Unet

输入: 代价体积(包含不同深度假设下的匹配代价)。处理使用卷积层提取特征。使用转置卷积层恢复空间分辨率。使用最终卷积层生成深度图。输出: 经过处理的深度图或概率图,用于进一步分析或计算。这个网络的设计通过逐步提取和恢复特征,有助于提高深度估计的精度,并更好地处理代价体积中的复杂信息。

2024-07-27 21:16:18 527

原创 代价体积(Cost Volume)

代价体积是一个三维张量,其中每个元素表示某个像素在不同深度假设下的匹配代价。这个代价通常反映了参考图像中的像素与源图像中对应像素的匹配程度。图像宽度(Width)图像高度(Height)深度层数。

2024-07-27 21:03:41 2060

原创 MVSnet自己学习记录

主要有这几个文件夹(自己已经修改过,初始不是这样)

2024-07-20 21:47:40 224

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除