JupyterLab Prodigy 扩展使用教程

JupyterLab Prodigy 扩展使用教程

jupyterlab-prodigy 🧬 A JupyterLab extension for annotating data with Prodigy 项目地址: https://gitcode.com/gh_mirrors/ju/jupyterlab-prodigy

1. 项目介绍

JupyterLab Prodigy 是一个用于在 JupyterLab 中注释数据的扩展。它允许用户在 JupyterLab 中直接运行 Prodigy,这是一个可脚本化的注释工具,用于创建机器学习模型的训练数据。通过这个扩展,用户可以在开发模型和应用程序的同时进行数据注释。

该项目的主要功能包括:

  • 在 JupyterLab 中直接运行 Prodigy 会话。
  • 支持多种注释任务,如命名实体识别(NER)、文本分类等。
  • 提供配置选项,允许用户自定义 Prodigy 的 URL。

2. 项目快速启动

安装依赖

首先,确保你已经安装了 JupyterLab 3.0.0 或更高版本,并且拥有 Prodigy 的许可证。

pip install jupyterlab>=3.0.0

安装扩展

使用以下命令安装 JupyterLab Prodigy 扩展:

pip install jupyterlab-prodigy

验证安装

确保扩展已正确安装并启用:

jupyter labextension list

启动 Prodigy 和 JupyterLab

在终端中启动一个 Prodigy 会话:

prodigy ner.manual my_set blank:en notebooks/news_headlines.jsonl --label PERSON,ORG,PRODUCT

然后在另一个终端中启动 JupyterLab:

jupyter lab

使用扩展

在 JupyterLab 中,打开命令工具栏(快捷键:⌘ CMD/Ctrl + SHIFT + C),搜索并执行 Open Prodigy 命令。这将打开一个新的 Prodigy 面板,你可以在其中进行数据注释。

3. 应用案例和最佳实践

应用案例

  • 命名实体识别(NER):使用 Prodigy 在 JupyterLab 中注释新闻标题中的实体,如人名、组织名和产品名。
  • 文本分类:注释文本数据以训练文本分类模型。

最佳实践

  • 配置自定义 URL:如果你的 Prodigy 服务运行在非默认 URL 上,可以在 JupyterLab 的设置中配置自定义 URL。
  • 使用虚拟环境:建议在开发时使用虚拟环境,以避免依赖冲突。

4. 典型生态项目

  • Prodigy:一个用于创建训练数据的脚本化注释工具。
  • JupyterLab:一个用于数据科学和机器学习的交互式开发环境。
  • Spacy:一个用于自然语言处理的 Python 库,与 Prodigy 紧密集成。

通过这些项目的结合使用,用户可以在 JupyterLab 中高效地进行数据注释和模型开发。

jupyterlab-prodigy 🧬 A JupyterLab extension for annotating data with Prodigy 项目地址: https://gitcode.com/gh_mirrors/ju/jupyterlab-prodigy

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孔岱怀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值