数据标注工具实践探索
1. Azure Machine Learning 文本数据标注
在 Azure Machine Learning 中,可按以下步骤进行文本数据标注:
1.1 选择标注方式与任务类型
在 Azure Machine Learning 数据标注中,有三种标注文本的方式:
- 使用单个标签进行标注。
- 使用两个标签进行标注。
- 对文本中的实体进行注释,例如文本中的人名、地点或组织。
可根据场景选择合适的标注任务类型:
| 任务类型 | 描述 |
| ---- | ---- |
| 文本多类分类 | 为整个文本条目从一组类别中仅分配一个标签。 |
| 文本多标签分类 | 可为整个文本条目分配两个标签。 |
| 文本命名实体识别 | 用于识别句子中的人物或组织实体等。 |
1.2 创建文本数据标注项目
- 点击数据标注页面上的“添加项目”。
- 输入文本数据标注项目的名称,选择“文本”作为媒体类型,并选择标注任务类型。
1.3 创建数据资产
可通过两种方式创建数据资产:从 Azure Blob 存储或从本地文件。选择数据资产后,点击“下一步”,“增量刷新”步骤可选,若需自动刷新标注项目中的新数据则需要此步骤,此例中跳过该可选步骤并点击“下一步”,随后进入标签类别屏幕。
1.4 选择标签类别
在标签类别页面,添加用于标注文本数据的标签类别,例如添加“动物”、“人”和“地点”标签类别来标注文
超级会员免费看
订阅专栏 解锁全文
1059

被折叠的 条评论
为什么被折叠?



