精灵标注助手制作VOC格式、XML格式、JSON格式、MongoDB格式数据集(详细图文教程)


在这里插入图片描述

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《图像增强》
📝《模型优化》
📝《模型实战部署》
📝《图像配准融合》
📝《数据集》
📝《高效助手》


在这里插入图片描述

一、精灵标注助手下载

精灵标注助手是制作数据集中比较容易上手的一款软件。
官网下载链接地址为:精灵标注助手
在这里插入图片描述

下载好后的样子如下,点击安装即可:

在这里插入图片描述

二、精灵标注助手使用

在精灵标注助手中实际操作的过程如下:

2.1 新建项目

新建项目方法见下:

在这里插入图片描述

下面选择图片路径和输入标签名:

在这里插入图片描述

2.2 矩形框标注

在右侧栏中选择矩形框,在图片上框选,再选择标签名,见下:

在这里插入图片描述

2.3 手动保存标注

这个软件不会自动保存,大家要记得每标注完一张图片,要点击一下界面左下方的勾,保存一下,见下:

在这里插入图片描述
在这里插入图片描述

2.4 导出标注

导出标注文件,这个软件不好的一点是,导出的路径不可以自选,操作如下:

在这里插入图片描述

2.4.1 导出格式选择

精灵标注助手支持XML格式,JSON格式,MongoDB格式,VOC格式标注,学者在最后导出时结合自己需求选择:

在这里插入图片描述

三、总结

以上就是使用精灵标注助手制作自己数据集的操作过程,这个软件有一定的局限性,还有其它标记工具,见下:

使用Labelimg制作VOC格式数据集或yolo格式数据集,详细教程见我另外一篇博文:Labelimg制作VOC格式数据集或yolo格式数据集

想使用CVAT制作COCO格式数据集或者VOC格式数据集,详细教程见我另外一篇博文:CVAT制作COCO格式数据集或VOC格式数据集

使用Labelme制作用于语义分割的.json格式数据集,详细教程见我另外一篇博文:使用labelme打标签

半自动标注工具ISAT,类似PS中的魔棒工具,点击目标物体自动框选,后台运行的是深度学习模型(多模型可选择),框选精度和打标签效率贼高,非常推荐学者使用此工具打标签,使用方法见:半自动打标签工具ISAT安装及使用教程

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

<think>好的,我现在需要帮助用户找到关于使用精灵标注工具进行实体标注教程。首先,用户的问题中提到了几个引用,我需要先仔细阅读这些引用内容,看看是否有相关信息。 根据用户提供的引用[1],精灵标注助手是一个支持图片、文本、视频标注的免费工具,这说明了工具的基本功能和优势。引用[3]和引用[4]则更具体地涉及命名实体识别和精灵标注工具的使用教程。特别是引用[4]详细描述了下载、安装和创建实体标注项目的步骤,包括如何设置实体定义和文本文件夹的位置。这些都是用户需要的教程内容。 接下来,我需要确认这些引用是否足够解答用户的问题。用户询问的是关于实体标注教程,而引用[4]已经提供了从下载到创建项目的具体步骤,应该能够满足用户的需求。同时,引用[3]虽然主要讲命名实体识别的任务,但也提到标注的类别,这可能对用户理解实体类型有帮助。 另外,用户可能还关心如何导出标注数据或与其他工具(如Hugging Face)集成。引用[2]提到了doccano的格式要求和Hugging Face的trainer使用,这可能与数据导出后的处理相关,但用户的问题主要集中在教程上,所以可能需要优先处理引用[4]的信息。 需要注意的是,用户提供的引用中有可能存在重复或交叉的信息,需要确保回答的结构清晰,分步骤说明,并正确标注引用来源。同时,用户可能对具体的操作细节有疑问,比如实体定义的格式或如何处理复杂标注情况,这些问题可能需要在相关问题中提及,引导用户进一步探索。 最后,要确保回答符合系统级指令,使用正确的中文表达,LaTeX格式无误,并且相关问题与主题紧密相关。检查是否有遗漏的步骤或需要补充的信息,比如软件更新后的界面变化或其他功能,但根据现有引用,应优先依据引用[4]的内容进行回答。</think>以下是关于精灵标注工具进行实体标注详细教程,结合官方文档和实践经验整理而成: ### 一、工具准备 1. 下载安装:访问官网 http://www.jinglingbiaozhu.com/ 下载Windows中文版[^1][^4] 2. 安装步骤:双击安装包按向导完成安装(建议关闭杀毒软件避免误拦截) ### 二、项目创建步骤 1. 新建项目 ```markdown 启动工具 → 点击"+" → 选择"实体关系标注" → 输入项目名称 ``` 2. 配置参数 - 文本文件夹:选择包含待标注文本的目录(支持.txt文件) - 实体定义:指定实体类型文件(如`entity.txt`),格式示例: ```text PER, LOC, ORG, TIME ``` 多个实体类型用英文逗号分隔[^4] ### 三、标注操作流程 1. **基础标注** - 选中文本 → 右键选择实体类型 - 支持嵌套标注(如"北京**市**"中标注LOC和GPE) 2. **高级功能** ```markdown - 快捷键标注:Ctrl+数字键快速切换实体类型 - 批量修改:支持标签的复制/粘贴/删除操作 - 颜色管理:不同实体类型自动分配区分色 ``` ### 四、数据导出 1. 导出格式支持: - BIO格式(常用序列标注格式) - JSON格式(含位置信息) - CoNLL格式(兼容主流NLP框架)[^3] 2. 导出路径设置: ```markdown 项目设置 → 导出选项 → 选择目标文件夹 → 确认标注编码(推荐UTF-8) ``` ### 五、应用对接 导出的标注数据可直接用于: - Huggingface Transformers训练[^2] - SpaCy实体识别模型 - BiLSTM-CRF等经典NER模型
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

视觉研坊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值