- 博客(683)
- 资源 (12)
- 收藏
- 关注
原创 WSL2 vscode debug配置
本文介绍了GDB调试环境的配置方法:首先通过sudo apt-get install gdb命令安装GDB调试器;然后建议在CMake编译时添加-DCMAKE_BUILD_TYPE=Debug选项启用调试信息;最后提供了一个VS Code的launch.json调试配置文件示例,包含GDB路径设置和基本调试参数。这些步骤可帮助开发者快速搭建C++程序的调试环境。
2025-12-23 10:55:56
41
原创 自动驾驶—CARLA仿真(27)start_replaying
CARLA仿真回放控制工具摘要 该Python脚本提供CARLA仿真回放功能,支持重放.log文件并灵活控制回放参数。主要特性包括:1)精确配置回放时间范围(起始/持续时间)和速度;2)提供跟随视角和顶视图两种观察模式;3)支持忽略主控车辆或自动跟踪指定Actor;4)可选传感器再生和地图覆盖功能。典型应用场景包括事故重现分析(慢动作回放)、全局交通观察、传感器数据再生等。使用时需注意Actor ID有效性、地图兼容性等问题,该工具为仿真调试和场景复现提供了专业级的回放控制能力。
2025-12-23 09:48:47
305
原创 自动驾驶—CARLA仿真(26)start_recording
摘要: 本文介绍了一个基于CARLA的轻量级工具,用于批量生成自动驾驶车辆并录制仿真数据。该工具支持快速部署指定数量车辆(默认10辆),通过--safe参数可自动过滤高风险车型(如两轮车、消防车等),并提供仿真录制功能(支持定时停止)。核心模块包括:参数配置系统、安全车辆过滤逻辑、高效批量生成实现(使用apply_batch_sync优化性能),以及仿真录制系统。适用于交通流测试、数据集生成等场景,但存在无传感器配置、固定出生点等限制。该工具为CARLA仿真提供了开箱即用的高效解决方案。
2025-12-22 10:00:27
588
原创 自动驾驶—CARLA仿真(23)V2XDemo 与 manual_control 比较
摘要: V2XDemo是manual_control的升级版,在保留车门控制、车辆遥测等核心功能的基础上,新增V2X通信支持(包括标准CAM消息和自定义消息收发),同时移除了LiDAR和车道入侵检测功能。二者主要差异在于:manual_control侧重车辆高级控制,而V2XDemo专注于V2X通信能力增强,通过新增V2X传感器和优化消息处理逻辑,为网联自动驾驶场景提供通信协议支持,但牺牲了部分传感器功能以聚焦通信模块。(149字)
2025-12-22 10:00:07
926
原创 自动驾驶—CARLA仿真(22)manual_control_steeringwheel demo
摘要: 该Python脚本实现了对Logitech G29方向盘的驾驶控制支持,适用于CARLA仿真环境。核心功能包括: 双模控制:方向盘为主,键盘为辅,通过DualControl类实现输入处理 真实物理映射:采用正切/对数函数模拟转向和踏板的非线性响应 可配置性:通过wheel_config.ini文件自定义设备映射 专业功能:集成传感器监控、HUD显示、天气切换等仿真管理功能 特点在于: 高精度的硬件输入处理 生产级的健壮性设计 开箱即用的HIL测试平台 适用于驾驶模拟、人机交互研究等领域,提供沉浸式控
2025-12-20 10:28:14
414
原创 自动驾驶—CARLA仿真(21)manual_control_carsim demo
CARLA手动驾驶控制客户端提供完整的车辆控制功能,支持油门、刹车、转向、灯光等操作,并集成多传感器(RGB、LiDAR、雷达等)。具备高级仿真功能如天气切换、地图图层控制及录制回放。通过World类管理车辆与传感器,KeyboardControl类实现全功能驾驶控制,HUD显示实时车辆状态。支持9种传感器模式切换,创新雷达可视化方案,以及数据记录功能。适用于交互测试、传感器调试和数据采集,是CARLA最全面的手动驾驶示例。
2025-12-20 10:27:43
867
原创 自动驾驶—CARLA仿真(20)manual_control demo
摘要: 该Python脚本是CARLA仿真平台中功能完备的手动驾驶控制客户端,支持完整的车辆操控(油门/转向/灯光等)、多传感器融合(RGB/激光雷达/雷达等)和环境动态调控(天气/地图图层)。核心模块包括: World类管理仿真环境与传感器系统 KeyboardControl实现真实车辆交互逻辑 Ackermann控制器提供高精度转向模型 HUD系统实时显示15+项车辆状态 14种传感器支持多模态数据可视化 录制回放功能保障实验可复现性 适用于自动驾驶算法测试、传感器调试和数据采集,是CARLA官方推荐的
2025-12-19 13:55:31
946
原创 自动驾驶—CARLA仿真(19)automatic_control demo
本文介绍了一个基于CARLA的自动驾驶代理演示系统,该系统集成了三种不同级别的自动驾驶代理(Basic/Constant/Behavior),能够自动规划路径并控制车辆行驶。系统包含完整的HUD信息显示、传感器管理和交互控制功能,支持多种驾驶风格和传感器配置。该实现为研究人员和开发者提供了开箱即用的自动驾驶测试平台,可直接用于高级行为策略或感知-决策融合研究,无需从零实现底层路径规划和控制逻辑。
2025-12-19 13:55:05
614
原创 自动驾驶—CARLA仿真(18)lidar_to_camera demo
本文介绍了将LiDAR点云投影到RGB图像的同步可视化方法。该方法通过同步采集LiDAR与摄像头数据,建立精确的3D→2D投影管线,实现点云强度信息的可视化。核心内容包括:1)同步数据采集机制,确保帧对齐;2)相机内参矩阵构建;3)完整的LiDAR→相机坐标变换链处理;4)点云可视化增强和有效点过滤。该技术适用于多传感器融合、感知算法调试和数据集生成,是自动驾驶感知系统开发的基础工具,特别适合需要精确2D-3D对应关系的任务。
2025-12-18 16:14:24
1033
原创 自动驾驶—CARLA仿真(17)invertedai_traffic demo
摘要: 该脚本实现CARLA与InvertedAI云服务的联合仿真,通过调用InvertedAI的API生成高真实感交通流,并在CARLA中同步渲染智能体行为。系统支持车辆与行人混合交通、交通灯联动及动态路径规划,适用于大规模自动驾驶仿真。 核心功能: 初始化流程:通过large_initialize生成50+车辆,解决CARLA原生生成点不足问题。 双向同步:交通灯状态和行人位置实时同步,确保AI车辆遵守规则并避障。 动态导航:结合CARLA路网补充InvertedAI的局部行为,实现长距离路径规划。 混
2025-12-18 16:13:28
555
原创 自动驾驶—CARLA仿真(16)generate_traffic demo
摘要: CARLA的Traffic Generator脚本支持大规模交通流生成,包含车辆/行人批量生成、Traffic Manager智能配置(跟车距离、混合物理模式等)、同步/异步模式切换等功能。通过蓝图过滤、原子化批量操作(100辆车生成<2秒)和资源安全管理,实现高效稳定的交通仿真。适用于自动驾驶压力测试,支持高密度交通、夜间场景等配置,是工业级仿真测试的核心工具。关键特性包括混合物理优化、行人行为多样性及可复现实验设计。
2025-12-17 09:31:44
822
原创 自动驾驶—CARLA仿真(15)get_component_test demo
本文介绍了通过CARLA仿真引擎获取车辆组件世界坐标的方法。示例代码演示了如何生成Audi TT车辆并查询其右前转向灯的世界位姿,核心是使用get_component_world_transform()接口。该方法适用于高精度传感器安装、V2X通信、碰撞检测等需要部件级定位的场景,是实现车辆数字孪生的关键技术。文章还解析了连接服务器、车辆生成、坐标查询等关键步骤,并列举了常见组件命名和应用案例。
2025-12-17 09:30:19
414
原创 自动驾驶—CARLA仿真(24)sensor_synchronization demo
多传感器同步采集底层实现示例 该脚本演示了CARLA同步模式下多传感器数据对齐的原理,提供线程安全的数据收集机制。通过配置固定仿真步长(0.2秒/5FPS)和同步模式,确保所有传感器数据在每帧就绪。采用轻量级回调函数将帧号和传感器名入队,使用queue.Queue保证多传感器并发安全。部署3个摄像头、2个LiDAR(不同点云密度)和2个雷达,验证同步机制的鲁棒性。主循环严格检查每帧是否收齐7个传感器数据,超时则警告。与高级封装方案相比,本脚本更适合底层调试和定制开发,是理解CARLA同步机制的最小可行示例。
2025-12-16 17:32:32
319
原创 自动驾驶—CARLA仿真(25)synchronous_mode demo
摘要: 该Python脚本演示了CARLA仿真环境中多传感器同步采集与可视化的实现方法。核心模块包括: CarlaSyncMode:通过上下文管理器确保RGB摄像头与语义分割摄像头数据严格同步,自动对齐仿真帧; 简化路径跟踪:车辆通过路点系统自动移动(非物理模拟); 图像融合显示:将语义分割结果以半透明形式叠加到RGB图像上,使用CityScapes调色板着色; 性能监控:实时显示仿真与渲染FPS。适用于多模态感知算法验证和教学演示,提供约30FPS的稳定数据流。 (149字)
2025-12-16 17:19:27
364
原创 自动驾驶—CARLA仿真(14)draw_skeleton demo
摘要:该Python脚本演示了CARLA仿真中行人骨骼的可视化功能,通过同步模式获取行人68个骨骼节点的3D坐标,并将其投影到RGB图像上。核心功能包括:1)同步处理传感器数据;2)3D到2D坐标转换;3)动态绘制骨架连线和关键点;4)实现摄像机环绕行人运动。适用于人体姿态估计、动作捕捉等研究,支持自定义骨骼拓扑和纯客户端渲染,是构建精确关节标注系统的理想基础。
2025-12-16 10:40:45
867
原创 自动驾驶—CARLA仿真(13)dynamic_weather demo
摘要:该Python脚本实现了动态天气控制功能,用于自动驾驶系统测试。主要包含三个模块:1) Sun类模拟太阳轨迹变化,通过正弦函数实现高度角动态调整;2) Storm类采用状态机设计模拟风暴生命周期,联动控制云量、降雨、积水等参数;3) Weather类集成天气系统。支持通过speed_factor参数控制天气变化速度,实现物理一致的时间缩放效果。该工具能生成渐进式天气变化,适用于摄像头、LiDAR等传感器在复杂天气条件下的性能测试,特别适合需要长时间环境变化验证的场景。
2025-12-16 10:40:39
672
原创 自动驾驶—CARLA仿真(12)client_bounding_boxes demo
本文介绍了一个基于CARLA的客户端3D边界框可视化示例,展示了如何在纯Python环境下实现车辆3D边界框的实时计算与绘制。该方案不依赖服务端,仅需RGB摄像头和车辆列表数据,通过完整的3D→2D投影管线,将车辆bounding_box转换为2D像素坐标。核心包括坐标变换链(局部→世界→相机→像素)、相机内参校准以及深度过滤等关键技术,是学习自动驾驶3D目标检测基础的重要案例。
2025-12-16 10:05:33
657
原创 自动驾驶—CARLA仿真(11)bounding_boxes demo
本文介绍了一个基于CARLA仿真环境的2D/3D边界框生成与可视化系统。该系统通过RGB摄像头和实例分割摄像头获取场景数据,实时计算并绘制2D/3D边界框,同时将边界框、速度、灯光状态等结构化数据保存为JSON格式。核心功能包括:数据结构定义、坐标变换与投影、实例分割解码、边界框生成、可视化系统以及结构化数据导出。该系统支持28类语义标签,可生成精确的3D检测参数,适用于自动驾驶感知算法训练、数据集生成和传感器融合验证,是构建自动驾驶感知pipeline的关键工具。
2025-12-15 18:27:03
1080
原创 自动驾驶—CARLA仿真(10)tutorial_gbuffer demo
本文介绍了一个高级传感器数据采集示例,用于在CARLA仿真环境中获取自动驾驶车辆的底层图形数据。该示例通过生成自动驾驶车辆并挂载高分辨率RGB摄像头,同时保存最终渲染图像和所有GBuffer纹理(包括场景深度、法线、材质属性等14+通道)。这些数据适用于计算机视觉研究、神经渲染、图像合成等需要底层图形数据的场景。文章详细解析了GBuffer的概念、主车与摄像头初始化方法、GBuffer启用与监听的核心代码,以及数据输出结构。同时指出该方法的性能开销较大,建议用于离线数据采集,并提醒注意磁盘空间消耗。该示例为
2025-12-15 17:43:01
478
原创 自动驾驶—CARLA仿真(8)tutorial demo
PythonAPI/examples/tutorial.py这是一个 **基础传感器数据采集示例**,演示如何:1. 在仿真中生成一辆主车并启用自动驾驶2. 为主车挂载一个深度摄像头(Depth Camera)3. 将摄像头捕获的图像**自动保存到磁盘**4. 动态调整车辆位置并批量生成 NPC 车辆适用于**数据集生成、传感器调试、自动化测试**等场景。
2025-12-15 16:54:21
552
原创 自动驾驶—CARLA仿真(9)visualize_multiple_sensors demo
car visualize_multiple_sensors 测试用例
2025-12-15 15:07:09
1281
原创 自动驾驶—CARLA仿真(5)Actors与Blueprints
CARLA仿真中的参与者与蓝图管理 CARLA仿真中的核心元素是参与者(Actors),包括车辆、行人、传感器、交通标志和观察者。参与者通过蓝图(Blueprint)模板生成,蓝图包含可修改属性(如颜色、传感器参数)和不可修改属性。蓝图库提供所有可用模板,支持通过ID查询或随机选择。参与者生命周期包括生成(需指定位置和旋转)、操作(物理状态控制)和销毁(需显式调用)。特殊参与者如传感器通过回调函数处理数据流,交通灯可通过API控制状态切换,车辆则支持多种控制模式。注意Python脚本结束时必须显式销毁参与者
2025-12-12 15:26:28
993
原创 自动驾驶—CARLA仿真(4)基础概念
CARLA仿真基础概念摘要 CARLA采用客户端-服务器架构:服务器运行仿真,客户端通过API控制。核心对象包括: Client:连接服务器的终端(默认端口2000),支持多客户端并行 World:仿真环境单例,管理地图、天气、参与者等 提供两种运行模式: 异步模式(默认):服务器自主推进仿真 同步模式:客户端通过tick指令逐帧控制,适用于数据采集和严格同步场景 关键功能: Recorder:二进制记录仿真状态,支持精确回放 渲染选项:支持Epic/Low画质模式及离屏渲染优化性能 (字数:150)
2025-12-12 14:52:23
923
原创 自动驾驶—CARLA仿真(3) 坐标和坐标变换
本文介绍了CARLA仿真引擎中的坐标系系统。CARLA采用Unreal Engine的左手坐标系,X轴向前,Y轴向右,Z轴向上,使用米和度作为单位。参与者(如车辆、行人)拥有各自的局部坐标系,原点通常位于包围盒中心附近。CARLA API提供了Location、Rotation和Transform类来处理坐标变换,支持全局坐标与局部坐标之间的转换。此外,CARLA还支持地理坐标转换,通过OpenDRIVE文件中的地理参考信息实现大地坐标与CARLA世界坐标的相互映射。这些功能为自动驾驶仿真中的定位和感知系统
2025-12-12 14:33:57
888
原创 自动驾驶—CARLA仿真(2)入门指南
CARLA是一款开源的自动驾驶仿真平台,提供逼真的城市环境和车辆模型。通过Python API,用户可以加载不同地图、添加车辆和传感器,并利用交通管理器控制NPC车辆行驶。主车(Ego Vehicle)是仿真核心,可安装多种传感器采集数据用于算法训练。CARLA支持同步/异步模式,包含8种不同风格的地图,涵盖城市、乡村和高速公路场景,为自动驾驶研发提供安全高效的测试环境。
2025-12-12 11:21:54
1123
原创 自动驾驶—CARLA 仿真(1)安装与demo测试
CARLA是一个开源的自动驾驶仿真平台,基于Unreal Engine构建,提供高保真图形渲染和多种传感器模拟。它具有可编程交通、开放地图编辑、Python/C++ API和ROS集成等特点,适用于自动驾驶算法开发、测试和多智能体仿真等场景。用户可通过官网下载安装包,支持Windows和Linux系统运行。CARLA凭借其高仿真度和灵活性,已成为自动驾驶领域主流的仿真工具,为算法验证提供安全高效的虚拟测试环境。
2025-12-11 16:39:36
1206
原创 视频动作视频-TimeSformer
TimeSformer:基于纯Transformer的视频理解开创者 TimeSformer是首个完全基于Transformer架构的视频理解模型,摒弃了传统3D卷积,通过时空注意力机制直接建模视频中的全局依赖关系。其核心创新包括:1)将视频分解为3D时空块;2)提出四种注意力策略(全局/分离/空间/时间),其中分离式时空注意力在降低计算复杂度的同时保持性能。该模型在动作识别任务中展现出优于传统卷积方法的性能,验证了纯注意力机制处理视频的可行性,但也面临计算量大、训练成本高等挑战。TimeSformer为视
2025-12-09 14:00:08
835
原创 大模型训练:LLaMA-Factory快速上手
本文介绍了使用LLaMA-Factory进行大模型微调的完整流程:1)环境配置(推荐CUDA环境+≥24GB显存GPU);2)数据准备(Alpaca格式JSON文件);3)多GPU训练流程(以LoRA微调Qwen-7B为例),包括配置文件设置和训练脚本参数说明。重点展示了如何通过accelerate启动分布式训练,包含显存优化策略(梯度累积、混合精度)和关键超参数配置(学习率调度、Lora参数等)。完整代码示例可供直接复现。
2025-12-09 13:52:41
541
1
原创 图像融合-泊松融合
泊松融合是一种实现图像无缝拼接的技术,通过求解泊松方程在梯度域上保持连续性。该方法首先计算源图像和目标图像的梯度场,将源图像梯度覆盖到目标区域,然后构建稀疏矩阵方程求解最优像素值。核心步骤包括:1)计算ROI区域和背景图像的梯度场;2)融合梯度场;3)利用拉普拉斯卷积核求解散度;4)构建并求解泊松方程Ax=b。该方法能有效保留源图像纹理特征,实现自然过渡的融合效果,在OpenCV等工具中已有成熟实现。相关论文和代码资源为研究者提供了详细参考。
2025-12-09 13:43:00
1236
原创 Transformers中的注意力方法简述
本文总结了多种高效注意力机制实现方案及其适用场景。FlashAttention系列(v2/v3)通过tiling和kernel融合技术显著提升训练和推理速度,尤其适合长序列任务。PagedAttention采用分页式KV缓存管理,极大提升推理服务吞吐量,是vLLM项目的核心技术。PyTorch的SDPA提供自动选择最优后端的通用接口。FlexAttention支持自定义注意力模式,适合结构化输入。根据具体需求,训练推荐FlashAttention或SDPA,推理服务首选PagedAttention,特殊模式
2025-12-08 17:12:20
958
原创 YUV格式介绍
YUV,分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。与我们熟知的RGB类似,YUV也是一种颜色编码方法,主要用于电视系统以及模拟视频领域,它将亮度信息(Y)与色彩信息(UV)分离,没有UV信息一样可以显示完整的图像,只不过是黑白的,这样的设...
2025-12-08 17:03:04
887
原创 深度学习框架keras使用—(1)CNN经典模型:VGGNet
2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员一起研发出了新的深度卷积神经网络:VGGNet,并取得了ILSVRC2014比赛分类项目的第二名(第一名是GoogLeNet,也是同年提出的)和定位项目的第一名。VGGNet探索了卷积神经网络的深度与其性能之间的关系,成功地构筑了16~19层深的卷积神经网络,证明了增加网络的...
2025-12-08 17:02:13
700
原创 initUndistortRectifyMap函数
CV_EXPORTS_W void initUndistortRectifyMap( InputArray cameraMatrix, InputArray distCoeffs, InputArray R, InputArray newCameraMatrix, Size size, i...
2025-12-08 17:00:46
134
原创 旋转量化精度验证
SpinQuant量化技术通过正交旋转(如Hadamard变换)将神经网络激活值中的异常值(outliers)均匀分散到多个通道中。该方法利用正交变换的保范数特性和Hadamard矩阵的"混频"效应,将原本集中在少数通道的高动态范围数值重新分配,使各通道数值分布更均衡。实验表明,在4-bit量化场景下,该方法能将量化误差降低14倍(从0.148降至0.0105),有效保留小数值信息。这种技术特别适合处理LLM中FFN层的结构化稀疏激活值,为低比特量化提供了更鲁棒的解决方案。
2025-11-21 11:42:20
69
原创 IQ4_NL量化测试
本文介绍了IQ4_NL量化技术,该技术将32个权重组织为一个块,并使用FP16块缩放因子,其模型大小与Q4_0和Q4_K_S相同。关键创新在于采用非线性映射将量化值转换为权重,显著提升了量化质量(困惑度接近Q4_K_S)。虽然推理性能与Q4_0相当(Metal平台上稍慢8%-20%),但文章指出通过行式实现并改用int8_t块缩放因子,可将比特率降至4.25bpw而不影响量化误差。文中的Python实现展示了完整的CPU版IQ4_NL量化器,包括256权重逻辑块的量化/反量化方法,以及基于官方LUT值的非线
2025-11-13 17:52:33
412
原创 Optimum:onnx模型量化
摘要:本文介绍了模型量化技术,包括动态量化和静态量化两种方法,以及校准步骤中的不同技术选择。量化通过使用低精度数据类型(如int8)降低模型推理时的计算和内存成本。文章详细说明了将模型量化为int8的具体步骤,并介绍了Hugging Face Optimum库提供的量化工具。最后给出了官方测试用例,包括模型转换、动态/静态量化实现以及量化模型的推理验证代码示例,展示了完整的量化流程。
2025-10-29 16:25:17
1000
原创 Optimum 将qwen3转onnx
特性是否使用 KV 缓存❌ 否✅ 是推理效率低(重复计算)高(增量计算)适合生成长度短长ONNX 模型复杂度简单较复杂(含 past/future 输入输出)推理代码复杂度简单需管理缓存状态推荐用途调试、简单 demo生产部署、性能敏感场景。
2025-10-28 11:40:35
1334
自动驾驶中的三维目标检测算法研究综述-2024年11月
2025-01-14
ModelNet40-normal-resampled-part2
2025-01-13
ModelNet40-normal-resampled-part1
2025-01-13
LBP-Learning-Multi-scale-Block-Local-Binary-Patterns-for-Face-Recognition.pdf
2019-05-28
GeoMatch_src(VS2015+OpenCv3.3版)
2018-10-19
Xilinx_Vivado_SDK_Web_2018.1_0405_1_Win64
2018-04-26
Edge Based Template Matching.pdf
2018-10-19
International-Conference-on-Computer-Recognition-Systems CORES 2013
2018-12-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅