JupyterLab Prodigy 扩展使用教程

孔岱怀

于 2024-06-19 09:39:24 发布

阅读量998

点赞数 10

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_00033/article/details/139792016

JupyterLab Prodigy 扩展使用教程

jupyterlab-prodigy 🧬 A JupyterLab extension for annotating data with Prodigy 项目地址: https://gitcode.com/gh_mirrors/ju/jupyterlab-prodigy

1. 项目介绍

JupyterLab Prodigy 是一个用于在 JupyterLab 中注释数据的扩展。它允许用户在 JupyterLab 中直接运行 Prodigy，这是一个可脚本化的注释工具，用于创建机器学习模型的训练数据。通过这个扩展，用户可以在开发模型和应用程序的同时进行数据注释。

该项目的主要功能包括：

在 JupyterLab 中直接运行 Prodigy 会话。
支持多种注释任务，如命名实体识别（NER）、文本分类等。
提供配置选项，允许用户自定义 Prodigy 的 URL。

2. 项目快速启动

安装依赖

首先，确保你已经安装了 JupyterLab 3.0.0 或更高版本，并且拥有 Prodigy 的许可证。

pip install jupyterlab>=3.0.0

安装扩展

使用以下命令安装 JupyterLab Prodigy 扩展：

pip install jupyterlab-prodigy

验证安装

确保扩展已正确安装并启用：

jupyter labextension list

启动 Prodigy 和 JupyterLab

在终端中启动一个 Prodigy 会话：

prodigy ner.manual my_set blank:en notebooks/news_headlines.jsonl --label PERSON,ORG,PRODUCT

然后在另一个终端中启动 JupyterLab：

jupyter lab

使用扩展

在 JupyterLab 中，打开命令工具栏（快捷键：⌘ CMD/Ctrl + SHIFT + C），搜索并执行 Open Prodigy 命令。这将打开一个新的 Prodigy 面板，你可以在其中进行数据注释。

3. 应用案例和最佳实践

应用案例

命名实体识别（NER）：使用 Prodigy 在 JupyterLab 中注释新闻标题中的实体，如人名、组织名和产品名。
文本分类：注释文本数据以训练文本分类模型。

最佳实践

配置自定义 URL：如果你的 Prodigy 服务运行在非默认 URL 上，可以在 JupyterLab 的设置中配置自定义 URL。
使用虚拟环境：建议在开发时使用虚拟环境，以避免依赖冲突。

4. 典型生态项目

Prodigy：一个用于创建训练数据的脚本化注释工具。
JupyterLab：一个用于数据科学和机器学习的交互式开发环境。
Spacy：一个用于自然语言处理的 Python 库，与 Prodigy 紧密集成。

通过这些项目的结合使用，用户可以在 JupyterLab 中高效地进行数据注释和模型开发。

jupyterlab-prodigy 🧬 A JupyterLab extension for annotating data with Prodigy 项目地址: https://gitcode.com/gh_mirrors/ju/jupyterlab-prodigy

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

孔岱怀 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。