
视觉相关
文章平均质量分 82
图像、视频等相关的学习笔记等
我宿孤栈
略略略~
展开
-
场景重建——Nerf场景重建
上海AI Lab和商汤的工作:本文提出了一种新的多视图隐式表面重建技术,称为StreetSurf,该技术很容易应用于广泛使用的自动驾驶数据集中的街景图像,如Waymo感知序列,而不一定需要LiDAR数据。我们的方法扩展了现有的以目标为中心的神经表面重建技术,以解决由非以目标为核心、长而窄的相机轨迹捕获的无约束街景所带来的独特挑战。本文的3D高斯Splatting的思想和Plenoxels一脉相承,均用尽可能传统但高效的表达方式来提高模型表达能力的下限,再结合一些可微的和可学习的思想来提高模型拟合的上限。原创 2025-02-28 22:45:42 · 948 阅读 · 0 评论 -
场景重建——3DGS重建和闭环仿真相关概念综述
三维场景的表征有很多种不同的方式,包括网格(Mesh),点云(Point clouds),深度图(Depth map)等。以下主要介绍显示几何表示、隐式几何表示和隐式神经表示三种表征方式。直接描述场景的几何结构,适合精确建模和可视化。多边形网格(Polygon Mesh)由顶点、边和面组成,任意多边形网格都能转成三角网格,网格有点,线,面,包含拓扑关系面。优点:高效渲染,轻量,可以表征复杂表面,包含更多拓扑和平面信息,可编辑广泛支持于游戏引擎(如Unity/Unreal)。缺点:难以处理复杂原创 2025-02-25 20:46:30 · 1310 阅读 · 0 评论 -
推理模型部署-训练好的权重文件如何生成.exe文件在另一台电脑运行
部署大型语言模型是一个详尽且复杂的过程,涵盖了从数据处理到模型优化、集成和维护的多个环节。通常模型训练好之后,在源码里边也有detect.py代码进行推理,但是如何将训练好的模型给下游使用或者部署到生产环境中而不使用源码呢?模型部署后,我们需要对模型的性能进行评价,以确保模型能够在生产环境中高效地运行。模型部署是机器学习应用中重要的一环,它可以帮助企业快速将机器学习应用落地,并带来实际的商业价值。总之,Python中有很多方法可以实现模型部署,需要根据具体的需求选择适合的方法。模型部署相关的上下游模块。原创 2024-04-24 15:05:16 · 1381 阅读 · 0 评论 -
YOLOv5标签值含义根据标签将检测框色块替换(马赛克)
获取了两个关键坐标后就可以进一步生成适配规模的色块图片并粘贴到目标图像中。此时,如何根据标签值将检测到的人脸同色块替换呢?关键是获取检测框的左上角坐标和右下角坐标。检测后生成的标签txt如下,原创 2024-04-08 15:15:52 · 602 阅读 · 0 评论 -
三维重建衡量指标记录
Completeness Rati (CR) 完整性比率完整性比率是用于评估三维重建质量的指标之一,它衡量了重建结果中包含的真实物体表面或点云的百分比。完整性比率通常是通过比较重建结果中的点云或三维模型与真实或标准点云或模型之间的重叠来计算的。具体计算步骤可能如下:定义真实模型和重建模型:首先,需要有一个真实的或标准的三维模型或点云,以及一个重建的三维模型或点云(由三维重建技术生成)。原创 2024-01-25 12:36:53 · 1456 阅读 · 0 评论 -
3D Guassians Splatting相关解读
本文通过协方差矩阵来表达该点,此矩阵控制3D高斯的形状。较之3节中推导的传统表达式,本文中的公式去掉了均值,因为该高斯分布以点为中心,xyz的均值就在点上已经中心化了,所以均值设为0;左侧系数是为控制整个概率密度函数的积分为1,但此处不需要,没有积分为1的限制所以整个分布的大小能够自由控制。从初始的SFM点云出发,以每个点为中心生成3D高斯;然后用相机参数把点投影到图像平面上(Splatting);原创 2024-01-16 16:00:12 · 3759 阅读 · 0 评论 -
win下C++通过Clion部署yolov5——libtorch+yolov5
其中【images】和【weights】即为二中下载源码中的【images】和【weights】,其他的头文件和源文件是二中源码。蓝色框则是添加需要运行的头文件和源文件,这里就是和博文。中的cmakelist.txt的不同之处,所以关于红色框和绿色框的路径地址怎么给,也可以参考该博文。在运行之前,需要将【images】复制到编译目录下,这是方便自定义给测试图片时路径书写方便。这里博主没有新建【include】和【src】目录,直接将5个文件复制到了新建项目下。对于终端会闪退的问题,可以添加如下代码解决。原创 2023-05-17 10:15:06 · 1231 阅读 · 0 评论 -
win下YOLOv7训练自己的数据集(交通标志TT100K识别)
遗传算法是利用种群搜索技术将种群作为一组问题解,通过对当前种群施加类似生物遗传环境因素的选择、交叉、变异等一系列的遗传操作来产生新一代的种群,并逐步使种群优化到包含近似最优解的状态,遗传算法调优能够求出优化问题的全局最优解,优化结果与初始条件无关,算法独立于求解域,具有较强的鲁棒性,适合于求解复杂的优化问题,应用较为广泛。大型数据集预训练好的权重主干特征提取能力是比较强的,这个时候我们只需要冻结主干网络,fine-tune后面层就可以了,不需要从头开始训练,大大减少了时间而且还提高了性能。原创 2023-03-29 13:42:27 · 4015 阅读 · 10 评论 -
YOLO5实战口罩检测识别(win下 + 环境部署配置 + 口罩YOLO格式数据集+训练好的权重)
win下YOLOv5实现口罩检测,整理好的YOLO格式数据集,训练好的模型权重,详细教程等等原创 2023-03-23 21:24:46 · 1727 阅读 · 0 评论 -
YOLO5用于交通标志牌(TT100K数据集)的训练预测(包含数据集格式的转换——TT100K-CoCo格式-YOLO格式,数据集比例的重新划分以及对应图片集的重新划分)
YOLO5用于交通标志牌(TT100K数据集)的训练预测:包含数据集格式的转换——TT100K-CoCo格式-YOLO格式,数据集比例的重新划分以及对应图片集的重新划分、配置文件的书写。。原创 2022-09-30 15:33:54 · 28494 阅读 · 114 评论 -
车道线检测laneatt算法实战CULane Datasets、Tusimple数据集——安装运行训练步骤
车道线检测laneatt算法实战CULane Datasets、Tusimple数据集原创 2022-11-04 11:19:06 · 2870 阅读 · 9 评论 -
通过YOLO5训练自己的数据集(以交通标志牌数据集TT100k为例)+ YOLOv5训练参数和测试(包含验证参数)参数介绍
数据集准备、训练、 train.py、 训练代码运行、 测试代码运行原创 2022-10-21 17:27:48 · 7543 阅读 · 4 评论 -
车道线数据集详细介绍以及使用方法汇总——CULane Datasets、Tusimple、LLAMAS、ApolloScape(后续会持续更新)
车道线数据集详细介绍,下载地址,使用方法汇总——CULane Datasets、Tusimple、LLAMAS、ApolloScape(后续会持续更新)原创 2022-10-19 15:12:31 · 6881 阅读 · 0 评论 -
车道线算法合集——各个车道线论文代码地址、算法总结、优劣分析
车道线算法(SCNN、LaneNet、End2end by Least Squares Fitting、PINet、LaneATT、SAD)总结,以及其优缺点罗列。原创 2022-10-19 14:56:29 · 2910 阅读 · 1 评论 -
相机标定、坐标转换
世界坐标→相机坐标、 像素坐标↔图像/物理坐标系、 像素坐标→世界坐标、 相机外参、相机内参、相机标定内容、 标定计算总公式、单应性变换、、物体在地面(Zw = 0)时的情况、 相机标定整体流程、 单目、双目、RGB-D标定优劣对比、 标定系数含义详解原创 2022-10-11 16:35:02 · 1229 阅读 · 0 评论