Labelme与Open3D集成：3D点云标注的扩展应用-优快云博客

Labelme与Open3D集成：3D点云标注的扩展应用

【免费下载链接】labelme Image Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation). 项目地址: https://gitcode.com/gh_mirrors/la/labelme

Labelme作为一款强大的2D图像标注工具，已广泛应用于计算机视觉领域。然而在三维视觉任务中，传统2D标注工具已无法满足点云数据处理需求。本文将详细介绍如何通过自定义扩展实现Labelme与Open3D的集成，构建完整的3D点云标注工作流，解决从2D图像标注到3D点云语义分割的全流程数据处理难题。

核心功能与应用场景

Labelme原生支持多种2D标注形式，包括多边形、矩形框、圆形等基本图形标注，这些功能主要通过labelme/shape.py模块实现。其标注结果以JSON格式存储，包含标注形状的坐标信息和类别标签，如examples/instance_segmentation/data_annotated/2011_000003.json所示。

Open3D是一个开源的3D数据处理库，提供了点云可视化、配准、分割等功能。将Labelme与Open3D集成后，可实现以下应用场景：

从2D图像标注生成3D点云伪标签
结合相机内外参数将2D标注投影到3D空间
基于标注结果进行点云语义分割训练数据制备

集成方案设计

技术架构

集成方案主要包含三个核心模块，通过扩展Labelme的标注流程实现3D点云处理能力：

mermaid

其中，坐标转换模块需要相机内参文件支持，可参考examples/instance_segmentation/labelme2coco.py的坐标转换逻辑进行扩展。

关键实现步骤

数据格式转换：扩展Labelme的JSON解析功能，增加点云数据支持
坐标投影计算：实现2D像素坐标到3D点云坐标的转换算法
可视化集成：将Open3D的可视化窗口嵌入Labelme界面
批量处理工具：开发从图像标注到点云标签的批量转换脚本

具体实现方法

1. 扩展标注文件格式

修改labelme/_label_file.py文件，增加对点云文件路径的支持：

# 在LabelFile类中添加点云路径属性
class LabelFile(object):
    def __init__(self, filename=None):
        self.filename = filename
        self.imagePath = None
        self.pointCloudPath = None  # 新增点云路径
        self.shapes = []
        self.imageData = None
        self.flags = {}

2. 坐标投影实现

创建新的转换模块labelme/utils/point_cloud_utils.py，实现相机投影矩阵计算：

import numpy as np

def project_2d_to_3d(uv, depth_map, intrinsic_matrix):
    """
    将2D像素坐标投影到3D空间
    :param uv: 2D像素坐标 (u, v)
    :param depth_map: 深度图数组
    :param intrinsic_matrix: 相机内参矩阵
    :return: 3D坐标 (x, y, z)
    """
    u, v = uv
    fx = intrinsic_matrix[0, 0]
    fy = intrinsic_matrix[1, 1]
    cx = intrinsic_matrix[0, 2]
    cy = intrinsic_matrix[1, 2]
    
    z = depth_map[v, u]
    x = (u - cx) * z / fx
    y = (v - cy) * z / fy
    
    return np.array([x, y, z])

3. Open3D可视化集成

扩展Labelme的主窗口类，在labelme/app.py中添加Open3D可视化组件：

import open3d as o3d
from PyQt5.QtWidgets import QDockWidget

class PointCloudVisualizer(QDockWidget):
    def __init__(self, parent=None):
        super().__init__("3D Point Cloud Viewer", parent)
        self.pcd = o3d.geometry.PointCloud()
        self.vis = o3d.visualization.Visualizer()
        self.vis.create_window(window_name="Point Cloud Viewer", width=800, height=600)
        
    def update_point_cloud(self, pcd_path):
        self.pcd = o3d.io.read_point_cloud(pcd_path)
        self.vis.clear_geometries()
        self.vis.add_geometry(self.pcd)
        self.vis.update_renderer()

4. 批量转换工具

参考examples/instance_segmentation/labelme2coco.py开发点云标签转换脚本：

# 批量转换命令示例
python labelme2pointcloud.py \
    --input_dir ./data_annotated \
    --output_dir ./point_cloud_annotated \
    --intrinsics ./camera_intrinsics.json

应用案例与效果展示

以视频标注场景为例，使用examples/video_annotation中的序列帧图像，通过本文方法生成点云语义分割标签：

转换后的3D点云标注效果：

原始点云：examples/video_annotation/data_dataset_voc/JPEGImages/00000102.jpg
分割结果：examples/video_annotation/data_dataset_voc/SegmentationClassVisualization/00000102.jpg

总结与扩展方向

通过上述方法，我们成功将Labelme的2D标注能力扩展到3D点云领域。未来可进一步开发：

AI辅助标注功能：集成点云分割算法，参考labelme/widgets/ai_prompt_widget.py实现智能标注建议
多视图融合标注：支持从多角度图像标注融合生成3D点云标签
动态物体跟踪：扩展examples/video_annotation功能，实现点云中动态物体的跟踪标注

完整的集成代码可参考项目的examples/instance_segmentation模块进行扩展开发，官方提供的标注教程examples/tutorial也可作为实现参考。

【免费下载链接】labelme Image Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation). 项目地址: https://gitcode.com/gh_mirrors/la/labelme

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考