【智路】智路OS Perception Camera Service

Perception Camera Service

https://gitee.com/ZhiluCommunity/airos-edge/raw/r2.0/docs/02_Service/Perception_Camera_Service.md

单相机感知模块的主要任务是接收IP相机RTSP视频流,将其解码成RGB图片,并通过算法识别视频中的障碍物,最终将结果转换到世界坐标系。

智路OS提供了单相机感知组件的示例实现,该实现包括四个子模块:检测、跟踪、ROI过滤、回3D。

检测

通过深度学习算法实现物体识别,包括物体类别、2D框、长宽高、朝向角、底面中心点图像坐标等信息。输入图像首先经过yolov3的backbone进行特征提取,2D阶段输出目标的类别、置信度以及2D框,3D阶段输出目标的长宽高、朝向角以及物体底面中心点的2D坐标。

ROI过滤

感兴趣区域(ROI)是从图像中选择的一个图像区域,是图像分析的关注重点。ROI过滤模块的主要功能是过滤掉感兴趣区域外的物体。

跟踪

跟踪模块的主要任务是在给定图像序列中找到运动物体,并对不同帧的运动物体进行识别。每个物体都有一个确定准确的ID,可以是人、车辆、锥桶、三角牌等。跟踪算法对每一帧检测数据进行跟踪信息维护,采用度量方式(如kalman预测框、IOU、点迹势函数、deep learning方法等)进行目标关联。成功跟踪的目标输出给下游使用,而维护的目标则进入下一轮跟踪循环。

回3D

根据模型预测的图像坐标系下底面中心点的图像坐标(u,v),利用地面方程和相机内参,计算得到相机坐标系下底面中心点的3D坐标(X, Y, Z)。然后,利用模型预测的物体高度h,计算得到物体中心点在相机坐标系下的3D坐标。

### Unity Perception 功能介绍 Unity Perception 是一款由 Unity 提供的工具包,主要用于生成训练机器学习模型所需的数据集[^1]。它特别适合于基于相机的用例,能够模拟各种传感器输入并生成高质量的合成数据。以下是其主要功能: #### 数据标注支持 Unity Perception 支持多种自动化的数据标注方式,包括但不限于边界框、语义分割图以及实例分割图。这些标注可以直接通过内置的感知组件完成,无需手动操作。 #### 场景随机化 为了提高生成数据的质量和多样性,Unity Perception 提供了强大的场景随机化功能。这允许开发者轻松调整光照条件、材质纹理以及其他环境参数,从而创建更加多样化且具有挑战性的训练样本集合[^3]。 #### 插件集成 作为 Unity 游戏引擎的一个扩展插件,Perception 可以与其他 Unity 工具和服务紧密结合工作。例如,在某些项目中可以配合 Ray Perception Sensor 来增强对象检测能力[^2];或者利用 State Machines 和 Behavior Trees 实现更复杂的交互逻辑设计。 #### 使用案例说明 对于具体应用场景而言,如果是在虚拟现实(VR)领域开发,则可能还需要考虑如何处理来自外部设备(如HTC Vive控制器)的位置信息更新问题。此时可以通过修改 SteamVR_TrackedObject 脚本来实现自定义身体部位跟踪效果[^4]。 ```csharp // 示例代码展示如何重写SteamVR_TrackedObject部分功能来适配特定需求 public class CustomTracker : MonoBehaviour { public Transform body; void OnNewPoses() { // 原始位置赋值被禁用 // pose.pos = transform.position; if (body != null){ body.localPosition = new Vector3(pose.pos.x, pose.pos.y, pose.pos.z); } } } ``` 以上就是关于 Unity Perception 的一些基本信息及其潜在用途概述。希望对你有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值