Prodigy是一款现代的标注工具,用于为机器学习模型收集训练数据,由spaCy的开发者开发。在本视频中,将展示如何使用Prodigy通过Python编写完全自定义的标注工作流程,如何接入您自己的机器学习模型,以及如何为特定用例混合搭配不同的界面。我们将创建一个图像描述数据集,使用PyTorch实现的图像描述模型来建议描述,并进行错误分析,以找出模型预测正确之处以及需要改进的地方。
分步指南
- 01:59 – 创建手动图像描述标注方案
- 13:26 – 接入PyTorch实现的图像描述模型并纠正其输出
- 19:41 – 添加回调函数以统计修改的描述并输出结果
- 26:33 – 添加错误分析和工作流以审查标注
PRODIGY资源
- 网站与文档:https://prodi.gy
- 在线演示:https://prodi.gy/demo
- 自定义方案文档:https://prodi.gy/docs/custom-recipes
- 论坛:https://support.prodi.gy
- 方案脚本:https://github.com/explosion/prodigy-…
本教程相关资源
- 代码:https://github.com/explosion/prodigy-…
- PyTorch教程与模型:https://github.com/yunjey/pytorch-tut…
- 图像数据集:https://www.kaggle.com/alessiocorrado…
关注我们
- Ines Montani: / _inesmontani
- Explosion: / explosion_ai
致谢
- 缩略图猫图像 #1:https://unsplash.com/photos/E9kVmtiqqGE
- 缩略图猫图像 #2:https://unsplash.com/photos/_Mty3g9XWr0
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
7万+

被折叠的 条评论
为什么被折叠?



