大模型训练
文章平均质量分 95
ringking123
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
nvidia PhysicalAI-Autonomous-Vehicles数据集介绍
原点:后轴中心在地面的投影点X 轴:指向车辆前方Y 轴:在面向前方时指向左侧Z 轴:指向上方。原创 2025-11-12 09:55:32 · 1180 阅读 · 0 评论 -
BEVFUSION-CUDA 解读
RsQ−zRsQ−zR:真实值Q:量化值s:比例(scale)z:偏移(zero point)fill:#333;color:#333;color:#333;fill:none;📂 加载预训练模型 (ResNet50)⚙️ 初始化量化器 quantize_net()🔄 激光雷达分支量化📸 相机分支量化(Bottleneck+Concat统一Scale)🧮 BN融合 + ReLU修正📊 标定300批次💾 保存量化模型 bevfusion_ptq.pth。原创 2025-10-24 09:24:42 · 929 阅读 · 0 评论 -
BEVFUSION解读(九)
fill:#333;color:#333;color:#333;fill:none;原创 2025-10-20 15:48:12 · 940 阅读 · 0 评论 -
BEVFUSION解读(八)
本文总结了BEVFUSION框架中激光雷达点云和摄像头数据的处理方法。对于激光雷达点云,介绍了五种处理方式:点基方法、体素基方法、柱基方法、图基方法和投影基方法(包括球面投影、圆柱投影和鸟瞰视图)。重点分析了体素化过程,包括将点云划分为规则三维网格的步骤,以及通过稀疏卷积网络提取特征的过程。对于摄像头数据,描述了从原始图像到特征提取的流程,包括将激光雷达点投影到图像平面获取深度信息的关键步骤。整体流程展示了多模态数据融合中两种传感器数据的预处理和特征提取方法。原创 2025-10-15 14:45:29 · 993 阅读 · 0 评论 -
BEVFUSION解读(七)
BEV池化技术原理摘要(150字): BEV池化是一种将3D点云特征转换为2D鸟瞰图表示的方法。核心步骤包括:1) 将激光雷达坐标系下的空间(-54m至54m范围)划分为360×360×1的网格;2) 每个网格内的点特征进行求和聚合;3) 通过坐标转换将点云映射到voxel网格。关键技术实现使用CUDA加速,通过计算每个网格的起始索引和长度,实现高效的分段聚合操作。其中,前向传播将点特征累加到对应网格,反向传播则将梯度广播回原始点。该方法通过特征相加的方式,将3D点云压缩为2D BEV特征图,适用于自动驾驶原创 2025-10-14 10:15:13 · 776 阅读 · 0 评论 -
BEVFUSION解读(六)
函数是 BEVFusion(或类似 BEV 特征融合模型)中一个关键步骤,用于将图像或多视角特征从 3D 空间投影到 Bird’s Eye View (BEV) 特征图上。代码中主要有两个输入:: 每个像素点(或特征点)在 3D 空间中的坐标(x, y, z)。从图中看,它的 shape 是:表示::batch size:6 个摄像头:深度采样层数:特征图的高宽:每个点的 (x, y, z) 坐标: 对应位置的特征向量(C 为通道数,例如 80)。先将 和 展平成一维。, 表示原创 2025-10-13 09:32:26 · 455 阅读 · 0 评论 -
BEVFUSION解读(五)
撤销后处理的平移和旋转:先对视锥体进行平移和旋转。深度缩放:将每个像素的uuuvvv坐标与深度值ddd相结合,得到实际的 3D 坐标。从相机坐标系到激光雷达坐标系的转换:通过旋转矩阵和内参矩阵进行变换,得到激光雷达坐标系下的点。额外的变换:根据输入的额外旋转和平移矩阵,对点进行二次变换。原创 2025-10-10 16:34:21 · 936 阅读 · 0 评论 -
BEVFUSION解读(四)
本文介绍了3D目标检测中数据预处理的关键步骤,包括坐标系转换和点云投影。主要内容有:1)详细推导了激光雷达到相机的坐标变换矩阵,解释了旋转矩阵求逆和平移向量计算;2)展示了相机内参矩阵构建和激光雷达到图像像素的投影过程;3)提供了多种坐标系组合变换实例,如世界坐标系转换。此外还简述了测试流程中的数据处理步骤,包括多视角图像加载、点云合并和3D标注加载等操作。这些预处理为后续3D目标检测任务提供了标准化的输入数据格式。原创 2025-09-29 16:23:58 · 758 阅读 · 0 评论 -
BEVFUSION解读(三)
模型提供的model.yaml配置文件的详细解释,并附上不同模型配置的说明。这个配置文件定义了一个多模态 BEVFusion 模型,结合了相机图像和激光雷达(LiDAR)数据,以进行 3D 目标检测。将逐步分析每个模块的作用以及不同模型选择的含义。原创 2025-09-28 15:57:45 · 636 阅读 · 0 评论 -
BEVFUSION解读(二)
nuScenes 风格的样例(通常是从 .pkl 里反序列化得到的 Python dict)解读。原创 2025-09-17 13:41:54 · 1195 阅读 · 0 评论 -
BEVFUSION解读(一)
NuScenes 点云到相机成像的流程,抽成**清晰的公式**,用统一的**齐次坐标**和**列向量**记号来写公式,同时也说明当前代码的**行向量实现**该怎么对应。原创 2025-09-17 10:43:35 · 1150 阅读 · 0 评论 -
BEVFusion & NVIDIA Lidar_AI_Solution 部署与测试笔记
本文介绍了BEVFusion与NVIDIA Lidar_AI_Solution的部署与测试流程。主要内容包括环境配置要求(CUDA≥11.0、TensorRT≥8.5.0等)、项目代码与数据集的下载方法(需递归克隆NVIDIA项目)、Docker环境配置与容器操作指南,以及MIT-BEVFusion项目的编译、训练和评估步骤。重点说明了使用nuScenes数据集时的注意事项,并提供了模型训练和评估的具体命令参数。该项目要求特定的硬件支持(Compute Capability≥sm_80)和严格的软件版本约束原创 2025-09-17 10:25:55 · 1084 阅读 · 0 评论
分享