Multi-Human-Parsing:多人场景细粒度解析的开源项目

Multi-Human-Parsing:多人场景细粒度解析的开源项目

1. 项目基础介绍及主要编程语言

项目名称:Multi-Human-Parsing(MHP)

项目简介:Multi-Human-Parsing 是一个针对多人场景的细粒度视觉理解的开源项目。该项目由新加坡国立大学(NUS)的学习与视觉(LV)团队提出,旨在推动对群场景中人类细粒度视觉理解的边界。项目包含了相应的数据集、评估指标和基线方法。

主要编程语言:JavaScript、Python、MATLAB

2. 项目核心功能

  • 任务定义:将群场景图像分割成属于身体部位或衣物项的语义一致区域,同时区分不同的身份,为图像中的每个像素分配语义部分标签及其所属的身份。
  • 数据集:项目提供了两个版本的数据集,分别包含4980和25403张图片,每张图片至少包含两人,平均三人体。数据集涵盖了18至58种不同的语义类别,并包含了2D人体姿态的16个关键点信息。
  • 评估指标:项目采用了两种以人为中心的评估指标,即基于部件的平均精度(APp)和正确解析的语义部件百分比(PCP)。

3. 项目最近更新的功能

  • 数据集更新:新版本的数据集增加了更多的图像和标注类别,使得项目能够支持更复杂的群场景解析任务。
  • 评估指标完善:项目进一步优化了评估指标,使其能够更准确地反映多人解析的性能。
  • 代码和文档:项目的代码和文档得到了更新和优化,使得使用和贡献变得更加容易。

该项目不仅为研究人员提供了一个强大的工具,也为开源社区贡献了宝贵的资源和知识。通过Multi-Human-Parsing,研究人员可以更好地理解和分析群场景中的人类行为和互动。

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值