- 博客(13)
- 收藏
- 关注
原创 Depth Anything论文速读
本文提出了一种新的通用单目深度估计方法,通过半监督学习解决数据标注瓶颈和泛化问题。核心创新包括:1)对无标注图像施加颜色和空间强扰动,迫使模型学习更鲁棒的特征;2)引入特征对齐损失,使学生模型与DINOv2模型的特征保持适度相似,平衡语义先验与几何判别能力。实验表明,该方法在KITTI和NYUv2数据集上超越现有模型,且验证了数据多样性、强扰动和语义约束的关键作用。该方法为构建通用的深度估计模型提供了新思路。
2025-10-20 16:30:07
372
原创 Depth Anything with Any Prior论文速读
本文提出了一种结合不完整但精确的深度测量与完整但相对深度预测的深度补全方法。通过粗填充阶段,利用k近邻算法和仿射变换将相对深度图转换为伪精确值填充缺失区域;在细优化阶段,引入条件卷积层融合RGB特征和深度信息,逐步优化填充结果。该方法有效解决了深度图空洞问题,同时保持了结构准确性。实验表明,该方法能够生成准确且完整的深度信息。
2025-10-20 16:27:31
171
原创 Depth Anything V2论文速读
【摘要】论文提出了一种结合合成与真实图像的深度估计训练方法,以解决传统训练数据的缺陷。针对真实图像存在标注噪声、细节粗糙等问题,该方法先利用合成数据训练精确的教师模型,再生成伪标记真实图像训练学生模型,实现细节精度与真实分布的统一。同时,论文改进了评估标准,通过多模型投票和人工判断相结合的方式,在多样化测试集上验证模型性能。该方法有效提升了模型在真实场景中的深度估计能力。(149字)
2025-09-07 14:34:21
258
原创 安卓开发——观察者模式的使用(ViewModel及MutableLiveData的使用)
这个被监听的变量就是被观察的对象,当这个对象发生变化时我们可以触发回调并进行相应处理。
2024-04-06 15:17:32
621
原创 开发日记--安卓开发中利用高德地图实现定位等功能
在开发校园公交项目时,司机端需要实现地图导航的相关功能。主要包括位置上传,位置获取,线路及站点绘制。
2024-04-05 21:51:46
1187
1
原创 开发日记--安卓开发中制作日历打卡签到功能
在安卓开发中,创建每日工作打卡功能,记录打卡时间来统计司机的上班情况。包括数据库,后端视图,前端UI及安卓主线程设计。
2024-04-04 12:35:01
1446
1
原创 如何在ubuntu设置开机自启动程序
在部署程序到边缘端时,我们总希望可以通电即启动我们写好的程序,本篇博客用以记录如何在ubuntu开机执行某条命令或者某个可执行程序。
2023-05-22 12:03:56
8602
5
原创 使用tensorrt在jetson nx中部署yolov5等目标检测模型(超详细)
在nvidia的jetson nx上使用tensorrtx来转换和部署yolo等模型的.pt文件,并使用cmake进行部署。
2023-05-18 14:32:35
6153
7
原创 使用c++onnxruntime部署yolov5模型并使用CUDA加速(超详细)
接到一个项目,需要用c++和单片机通信,还要使用yolo模型来做到目标检测的任务,但目前网上的各种博客并没有完整的流程教程,让我在部署过程费了不少劲,也踩了不少坑(甚至一度把ubuntu干黑屏)。于是想把训练及部署过程记录下来,并留给后来者方便使用。(博主使用的系统是ubuntu20.04)
2023-04-01 20:03:55
13683
22
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅